2.1企业信息的类型
把生产制造过程转化为信息处理过程,首先要研究如何定义和采集信息。这个问题与企业的主要信息来源有关,应该根据信息的来源决定信息的定义和采集方案。
企业信息主要涉及以下4类:
(1)现场信息;
(2)管理信息;
(3)工程信息;
(4)社会信息。
在实际信息系统中,上述4类信息交织在一起。例如,MRPⅡ(制造资源计划)的零件主数据文件含有100多个数据项,由现场、管理、工程3类信息组成。
原始信息通常是非结构化和杂乱无章的,必须经过规范化定义后才能在信息系统中发挥作用。经规范化整理后的信息可以分成以下3类:
(1)固定信息
固定信息又称静态数据。一般是指生产活动开始前需要准备的数据,例如与产品设计和工艺路线有关的数据。事物的运动是永恒的,固定是相对的。固定信息只是相对生产活动而言是暂时不变,但是也要定期维护,以保持准确性。
(2)流动信息
流动信息又称动态数据。是指生产活动中产生的数据,例如加工单、库存记录、质量报告等。现场信息都是动态数据。流动信息具有实时性,需要用自动或者手工方法及时维护。
(3)中间信息
中间信息又称中间数据。是根据管理要求,由系统按照一定的逻辑程序,综合静态和动态两类数据,经过处理而形成的各种报表。中间信息以信息的形式反映生产中的物料变化过程和相应的资金流变化过程。中间信息对管理人员了解、分析生产状况和进行决策是非常重要的。软件系统功能的强弱很大程度上体现在它产生中间信息的能力。
在信息系统中,各种信息都以结构化的形式被存储和使用。但是,由于信息来源不同,定义的方法和对信息结构的安排会有所不同,采集方法和输入系统的渠道也有所不同。一般说来,现场信息存储在实时数据库中,管理信息存储在管理数据库(最典型的是关系数据库)中,工程信息在设计过程中产生,通常存储在工程数据库中。这3类数据库的相互访问往往成为企业级信息集成的重点和难点。
2.2现场信息的定义和采集
2.2.1现场信息的意义和内容
现场信息是指在产品生产过程中产生的物理、化学、生产进度、物料输送、零件加工、产品质量等方面的数据。现场信息对生产过程控制和产品质量影响很大,还会影响生产管理、生产计划、财务、成本等。把这些数据记录下来,一方面可以调整在线生产计划和进度,另一方面可以存档备案,作为以后分析产品质量或者设计新产品的依据。在产品生产过程中,从原材料开始到最后成品入库,会产生一系列的理化数据,例如,原材料的质量数据,在制品的质量数据,配套部件的技术参数,产品的规格、型号、批次和技术参数等。对于化工、制药、钢铁等行业,生产过程的数据,例如压力、温度、用电量、化学成分等对产品质量和性能有很大影响,必须记录下来。一些与生产进度、生产管理、产品质量有关的数据,不仅要记录下来,而且还要求及时传送到位,管理人员可能会根据它们来调整生产计划。
现场信息通常伴随过程控制或者设备控制而产生。由于实时性的要求,它们一般存储在特定的程序中,如果数据比较复杂,还需要建立实时数据库。实时数据库一般没有专用的数据库管理系统,编程人员根据控制或操作的要求来设计数据库的数据结构并编写管理程序,例如链表、广义表、数组、数组集合、对象等都支持对现场数据的实时管理。实时数据库的信息更新很快,一般不保留历史数据。如果要保留某些有用的数据,通过接口传递到管理数据库比较好一些。已有专用的商品软件,例如ONSPEC等,能够支持实时数据库和管理数据库之间的数据交换。
把实时数据传递到管理信息系统,除了考虑将在第3章讨论的通信问题外,还要注意现场信息所描述的理化特征往往对应于实体属性而不是实体本身。现场信息例如温度、压力、流量、规格、型号等都是表达事物特征的量,一般不能把它们直接定义为实体,而是把它们作为某个实体的属性。有时为了避免破坏管理信息系统的结构,也可以定义专门存储现场数据的虚拟实体。此外,数据编码规范中必须指明理化数据的量纲,否则使用中会因为对量纲的理解不一致而产生差错。在进行系统分析和设计时,应该注意理化特征对实体的依附作用。表达信息流向,特别要避免容易产生误解的表达方式,例如,在数据流程图(DFD)中要标识数据流是由实体还是由实体属性所构成。理化属性的命名决定于两个因素:数据源的位置和一一对应的原则。来源于同一个数据采集点的理化量只能使用惟一的属性名称和拥有相同的记录内容,而不管它作为哪一个实体的属性。同一数据源所采集的数据被定义为多个实体的特征也是常有的事情,但要注意保持它们的一致性。
现场信息,例如温度、压力、流量、化学成分等一般不能定义为实体,而只能定义为实体属性。在系统总体设计中,可以结合实体的定义来考虑有关的现场信息,特别是影响生产计划和产品质量的现场信息,应该包含在数据库的概念模式中,这些数据从现场采集后就可以通过接口传输到数据库保存下来。现场信息的实时性很强,更新比较快,中间数据不保留,它们通常定义为某种数据结构,由专门的程序段管理。如果想较长时间保存现场数据,应该把它们传送到管理数据库中。在购买商品化管理软件的情况下,如何保存现场信息,则要根据具体情况采取不同的对策。首先,考察所购买的管理软件的模式或者数据字典,如果其中已经包含了我们感兴趣的现场信息,那么问题就很简单了。其次,对于没有被现有管理软件的数据字典包含的现场信息,考虑能不能通过增加字段的办法把它们分别放在有关的实体中,或者把它们统一定义为虚实体,扩充原有的数据模式。使用这种方法要特别注意,不要破坏已有的数据模式。第三,利用分布式数据库管理系统的优点,为全部有用的现场信息定义一个专用数据库。通过专用数据库来隔离现场数据库和管理数据库,以保持它们各自的独立性,当某一边发生变化时对另外一边不会产生影响。专用数据库和管理数据库由分布式数据库管理系统统一管理。
2.2.3现场信息的采集
现场信息的采集可以分为在线和离线两种方式。在线采集是指在设备运行状态下或者生产正常运行中对有关理化量的记录和传递。在线采集的数据都是实时数据,一般可以自动完成,使用自动或者人工的方式输入信息系统。离线采集是指由对象的样本在非运行状态下获取的理化数据。离线采集分两个步骤进行,先在工作现场取样,然后对样本进行分析。可以使用自动或者人工的方式把数据输入信息系统。
在线采集理化数据的方案有很多种。最基础的方法是直接由传感元件或者传感器获取数据。传感元件种类很多,从原理上讲,主要是根据光电、压电、电磁、热敏、声音、速度、光谱、机械变形等效应获取对象的理化量动态特征。传感器通常与有关仪表连在一起才能方便地记录数据。在这种情况下,可以采用人工读取数据和输入信息系统的方案。自动读取数据和自动输入信息系统是一件比较困难的事情,因为传感器直接提供的数据很可能不是电信号,即使是电信号,由于表现形式为模拟信号,其含义也不能被计算机接受和理解。在自动化设备中,传感器是控制器的组成部分,数字化控制器具有A/D(模/数)转换单元,获取数字信号比较方便。
控制器是一种自动化部件,品种十分复杂,它们往往由提供设备的厂家自行设计和开发。控制器的主要功能是控制对象,使这些对象按照规定的程序工作。控制器有数字化、非数字化、智能化等不同类型。原则上,所有的控制器都能提供其控制量的电信号。可以从A/D转换模块或者CPU系统取出信号。
问题在于生产厂能不能提供理解这些信号的协议或者约定,以及这些协议、约定能不能很方便地被信息系统接受和理解。
在控制系统中使用最多的控制器是可编程序控制器(program mable control-ler),其缩写本来应该是PC,为了与个人计算机的缩写PC相区别,习惯上把它的缩写改为PLC。PLC实际上是一种专用的微处理器,它的组成与通用的微机基本相同,包括硬件与软件两部分。图2.2是PLC硬件系统的简化框图。来自现场设备例如开关、按钮、传感器和检测仪表等的信号,经输入单元读入微处理器CPU,在系统程序的管理下,由用户程序解读,处理结果通过输出单元去驱动被控制的伺服机构或者有关设备。
PLC具有较高的可靠性。它是专为工业控制设计的电子装置,制造工艺有严格的措施来保证质量,加上硬软件故障检测、自诊断、信息保护和恢复等功能,因此具有较强的抗干扰能力,能够适应工业现场的恶劣环境。PLC按照专门设计的程序工作,对于有一定的计算机知识的技术人员,编写PLC程序不是困难的事情。
PLC有各种规格的I/O(输入/输出)接口和功能模块,使用方便,接线十分简单,只需将产生输入信号的现场设备(按钮、开关等)与PLC输入端子连接,将接受输出信号的执行元件(接触器、电磁阀等)与PLC的输出端子连接。使用PLC的控制系统通常可以在实验室编程、模拟、测试后,在现场很快安装调试成功。向信息系统提供的信号原则上可以由输入单元、输出单元或者扩展I/O接口获取。获取信号的具体位置根据需要决定。困难在于现场技术人员往往不掌握通信协议,因此不能正确理解信号的含义,需要设备供应商的支持。随着企业信息化的发展,对PLC与管理信息系统连接的需求越来越多,已经有专门的公司为用户提供这种技术服务。PLC的性能通常用多种指标综合表示,例如I/O总数、用户程序存储器容量、扫描速度、指令种类数、编程语言、特殊功能、智能I/O、远程I/O、通信联网等。
作为整体自动化的生产系统,具有完整的现场信息采集方案,在控制生产或加工过程的同时,还能提供生产管理和计划系统、工程设计系统、质量保证系统所需要的各种信息。有两类系统值得企业信息化工程关注:集散控制系统(DCS)和制造自动化系统(MAS)。第4.4节将以MAS为背景介绍与现场自动化有关的问题。
DCS在流程行业例如化工、炼油、钢铁、发电等行业广泛使用,本书将在有关案例中对DCS作简单介绍。
2.3管理信息的定义和采集
在企业信息化工程中,企业管理信息的采集是最关键、最基础的工作。我们前面已经讲到,企业的管理信息系统是实现了局部信息集成的软件系统,一般把它称为制造资源计划(MRPⅡ)或者企业资源计划(ERP)。设计这样的软件系统是一件相当复杂的工作,必须由专业人员才能完成。对于大多数企业而言,没有必要自己组织力量来开发这样的系统。在购买商品化管理软件的前提下,企业信息化仍然有很多工作要做。这些工作包括整理流程、定义数据、分析流向、建立原型、制定规范等。
2.3.1管理信息和管理信息系统
(1)数据库的三级模式
数据库是管理信息系统工作的基础。在数据浏览、输入和输出时,从表面上看是对信息系统进行操作,实际上是在访问数据库。当不同的用户使用的数据来自同一个数据库时,就实现了信息共享。数据库的数据模式结构从逻辑上可以分为3级:外部级、概念级和内部级。数据库系统相应的三级模式分别为:外部模式、概念模式和内部模式。
外部模式又称为子模式或用户模式,是管理信息系统用户看到的数据视图。
它是数据库三级结构中最接近于用户的结构。每个用户都以自己的观点使用一个外部模式,来对数据库的部分数据结构进行逻辑描述。用户使用的操作界面和报表通常都是在这个级别上的逻辑项目或者逻辑项目的延伸。
概念模式又称为逻辑模式,是对数据库中全体数据逻辑结构和特征的描述。
一个数据库允许有许多不同的外部模式,但是只有一个概念模式。它描述了整个数据库的逻辑结构,包括现实世界中实体的性质与联系,定义记录、数据项、数据的完整性约束及记录之间的联系。概念模式通常简称模式。子模式是模式的一个子集,从一个模式可以导出许多个不同的子模式。
内部模式又称为存储模式,是数据在数据库内部的表示,即数据的物理结构和存储方式的描述,包括各种存储记录的类型、索引及其字段、记录的物理存储顺序等。
(2)实体-联系模型
实体-联系(E-R)模型是最常见的概念模型,用于描述整个数据库的概念模式而不考虑物理数据库如何设计。它能充分反映现实世界,易于理解,将现实世界的状态以信息结构的形式很方便地表示出来,是企业信息化工程总体设计的一个有力工具。
E-R模型中涉及的主要概念有:
a.实体。实体表示客观存在并可以相互区分的事物。实体可以是人、物等实际的对象,也可以指某些概念;可以是事物本身,也可以指事物与事物之间的联系。