林新宇 袁文聪
(1.首都博物馆,北京,100045)
(2.上海金鑫计算机系统工程有限公司,上海,200040)
摘要:根据首都博物馆业务需求,我们搭建了基于多层次集成技术的数字化博物馆资源共享综合服务平台。该平台在国内博物馆的信息资源整合领域做了一次开创性的尝试,填补了文博资源集成共享和综合服务应用开发的空白。平台已成功应用于首都博物馆数字化系统中,使多个子系统的多项业务资源共享,且每个系统不再孤立,有机地合成为一个动态的整体,取得了良好的应用效果。
关键词:SOA开放式体系架构多层次集成技术共享元数据
一、引言
首都博物馆作为大型综合性博物馆,展示了首都的历史文明和现代化成就,体现了国际大都市的风貌。首都博物馆数字化工程的目标是融合现代化的数字技术,打造超一流的数字博物馆,充分发挥数字化优势,提升博物馆的收藏保管、宣传教育、陈列展示、学术研究、观众服务、国际交流等各项服务能力。
首博数字化系统由计算机局域网络、数据库系统、集成管理、办公自动化、文化遗产管理、多媒体采集与存储、网站、多功能会议厅、视听室、教育广播、多媒体展陈后台等11个子系统所组成,其中计算机局域网络是首博信息系统的支撑平台;数据库系统、集成管理系统是整个数字化系统的核心和统领框架,贯穿始终。
在开发技术上,SOA开放式体系架构、交互式信息聚合技术、数据交换共享技术、分级授权统一身份认证、网络爬虫等项有所创新,开发的综合信息平台在专业上满足文博专家对“文物资源”共享综合利用的需求,并树立了业界系统多层次整合的典范,首次将网络爬虫技术应用于国际文博信息采撷,符合“文物研究”特点,在我国博物馆信息化系统中尚属首创。
首都博物馆新馆数字化系统在国内博物馆的信息资源整合领域做了一次开创性的尝试,使11个子系统的多个业务系统资源互通,且每个系统不再孤立,有机地合成为一个动态的整体,更好地满足了博物馆在行政管理、科研业务以及观众服务等各个方面的需求,填补了文博资源集成共享和综合服务应用开发的空白。
二、共享元数据规范的设计
制定支持分布式环境下通过统一信息描述方法对各应用系统之间数据共享和交互。各应用系统与数据中心相连,通过数据中心来实现数据共享和路由。这种连接方式实现了数据的共享访问,保证了各业务系统的有效协同,同时又能保证各应用系统的相互独立性和低耦合性,从整体上提高了系统运作效率和安全性。
为了便于说明,这里我们假设包N有一数据表TB_TEST1需要共享给包1与包2,则由包N提供数据表描述文件,通过数据项管理端登记:
提供方系统号:包N(中文)/client1(英文)
共享文件夹地址:数据表标识符:测试1(中文)/test_metainfo(英文)
主表名:TB_TEST1
主表发送标志字段:sendflag
数据查询SQL:select from[TB_TEST1]where sendflag="0"
代理端IP地址:192.168.0.1
数据获取方:包1、包2
数据发送方式:全部记录每次一条
时效性要求:高(准实时)中空闲时间处理
字段属性描述见表1:信息支撑平台的设计
计算机局域网络是首博信息系统的支撑平台,作为博物馆行业系统,它是由大量的非结构化数据,包括一些高精度图片和大量的音视频文件组成的资料性的系统。这个资料性的系统又同时具备了用户、业务层次鲜明、安全性要求高、数据更新效率低的特点,针对这些特点,我们是这样构建首博计算机局域网络的。
采取多层次网络结构,虚拟子网与物理专网相结合,对网络资源进行有效划分;采取多冗余的设计,双核心交换机、服务器集群、双电源、磁盘RAID组等,增强系统的可靠性和可用性;根据博物馆系统数据容量大、集中管理的存储特点,采用SAN存储。
首博整体网络采用星形结构。根据首博数字化系统的流量需求,采取千兆主干、百兆桌面。对远程访问,采用Internet与VPN相结合的方式实现馆外库局域网络与馆内网络的安全连接,实现员工异地办公的需求。
在内部使用上,使用vlan技术将首博各业务部门划分到各自的网络中,在保证网络安全的前提下,实现资源在各部门中的共享。根据首博的业务与应用需求,已建立了33个专用子网。分别进行了不同等级的网络安全保护,与业务数据交换规则。另外,其中4个专用子网:首博服务器、人事、财务和多媒体采集这四个子网使用专门的内部防火墙隔离,确保其安全。
在安全保障上,根据国际计算机安全规范与防护模型,为关键业务与安全隐患点配置了IDS、漏洞扫描、防病毒系统、反垃圾邮件系统等多种防控手段,实现计算机网络中各层次(物理层、逻辑层、服务器层、应用软件层、数据库层等)的安全,为保证业务系统的稳定运行打下了坚实的基础。
另外,首博还针对每个系统应用,部署了统一管理平台,实现从网络、系统、应用、业务几个层次进行网络设备、服务器系统软件的故障、性能、服务的统一监控和管理。例如,我们可以实时获取首博网站服务器运行状况的信息,如其网络峰值、CPU、内存占用率等,以及其系统应用中每个进程的运行状况,如发布程序的使用状况、数据库的连接情况。我们根据首博每项业务的特点,针对系统定制了监控策略,尽最大可能反映出首博综合信息平台的整体运行情况,并以此为依据进行细化调整。
四、数据库系统的设计
数据库系统是首博整个数字化系统的核心。首都博物馆的数据库设计成面向不同的应用需求,有前台数据库群、后台数据库群和部门数据群三个层次的数据库系统,并且通过系统前端的综合信息平台来展示和检索其中的共享数据内容。
数据共享平台是前台数据库群和后台数据库群以及部门数据库之间作为内部综合检索和展示使用的综合信息数据库和各数据库之间进行数据交换的支持平台。首博数据化系统由庞大的数据库群支持着,综合信息中央基础数据库作为核心使整个数据库之间不再孤立、静止,整个数据库系统以综合信息中央基础数据库为轴心运转起来,彻底消除了系统间的消息孤岛,为博物馆的信息化建设迈出了一步。
数据库系统主要功能:
综合信息平台:是多种资源集中综合展示门户,它以数据共享平台为基础,多种资源综合展现,这填补了国内综合服务应用开发的一个空白。综合信息平台登录后的首页页面包含五个工作区。个人办公区:增设了个人收藏夹功能;专业助理区:特别设置即时讯息服务;公共信息区:重要通知、网上会议互动等;综合资料区:提供综合库的查询和服务功能;专用级入口区:各专用子系统的门户。
跨资源检索系统:通过跨资源检索引擎进行跨资源统一查询,实现了6大块独立数据的整合、查询与展示,用户只需使用系统所提供的搜索引擎,根据关键词就可查找到所需要的文物信息,并且在获取文物信息的同时,得到所查询文物相关的图片、三维、文献等多种类、多层次的复合信息服务。藏品描述的打标工具,是对文博知识信息进行同义通义处理的手段和工具。
个性化标签(Tag)服务:为了提高工作人员对系统的使用效率,提供了自定制标签服务和个人收藏夹功能,用户可以通过定制标签,然后手动添加,系统也可以根据用户定制的标签自动推送信息,由用户进行选择收藏。
信息专报和分类统计:通过多样式的分时、分类统计,可以定期了解博物馆全局运行状态和资源建设情况。
信息打标系统:关键字打标是对首博文献资料进行主题词的关联,正如藏品描述中的“孔子、孔丘、字仲尼……”就是打标的一种结果。在实现上我们采用先进的多模式匹配算法,模式匹配效率高。
基于网络爬虫的主题资料检索:针对文物研究的需求,研究人员不仅要研究本馆馆藏,而且也要收集、了解馆外资源,首先通过定制主题词,然后从指定网站采集主题相关网页,抽取到多种页面结果,最后将这些获取到的页面在综合信息中进行有选择的展示、分析和处理。
五、集成管理系统的设计
集成管理系统是首博整个数字化系统的统领框架,贯穿始终。集成包括数据集成、操作界面集成、应用集成和管理集成。
数据共享平台是重要的数据交互工具,是各子系统之间进行数据交互的桥梁,通过其实现数据集成;全局用户身份认证平台基于WEBST网络应用安全平台的安全用户认证,根据用户权限配置相应的功能入口,通过其实现操作界面集成;综合信息平台入口管理模块为系统功能入口提供便利的配置界面,使用户可以通过配置来更改主界面的功能入口,通过其实现应用集成;我们通过全局用户身份认证平台和综合信息平台入口管理模块相结合来实现软件系统的管理集成,通过前面介绍的NetGain平台来实现网络设备以及服务器系统软件的管理集成。
集成管理系统主要功能:
数据共享平台:为EAI数据资源集成中间件,消除信息孤岛,提升数据使用效率,提高信息化整体服务质量和整体效益。建立数据共享平台,使各个子系统在数据层面实现安全、可靠的资源交互。
全局用户身份认证系统:是分级授权的体系,采取安全的身份认证算法。每一位首博工作人员都将拥有一个系统账号,使用系统账号,用户可以顺利登录到综合信息平台。全局用户身份认证并非仅仅是验证用户身份的合法性,还会根据用户所具有的实际权限,为用户动态分配各个专业子系统的入口。
综合信息平台入口管理:来实现系统的应用集成,管理员可以动态地锁定页面,并能定制登录首页应用模块的入口;所有定制操作不需要任何的编程改变;页面可以动态组织,不同的用户角色可以看到不同的页面、内容和导航界面。
六、系统特点
综合以上叙述,可以看出首都博物馆新馆数字化系统有如下特点。
先进性、可扩展性:数字化规范具有行业重要参考价值;“开放兼容、可持续发展”的SOA系统模式;“互通互融、求同存异”的多层次松耦合集成;“综合信息、一网打尽”的综合信息平台。
实用性:“一个入口、四通八达”的全局身份认证平台;“统一访问、多维展现”的跨资源检索引擎。
专业性:“量身定做、独具匠心”的文博主题资料采撷、信息打标系统;
安全性、一致性、通用性:WS-Security(X.509证书、RSA与DESede加密算法)、Web Service的IP访问控制、数据路由策略等技术的应用保证数据交换的安全性;数字签名、XML Schema的验证、相关附件SFV码验证等技术的应用保证数据交换的过程中的一致性;Java开发、支持FTP、HTTP等多种协议的附件传输、Socket通信协议消息驱动等技术的应用保证系统的通用性。
七、展望
博物馆信息化建设是个长期的、不断完善、发展的任务,首博数字化系统因其开放式的体系构架、深入的综合服务使“数字首博”向更高层次发展成为可能。
在总结和借鉴建设成果的基础上,后续工程将更多关注数字文化遗产技术在文化服务、文物研究、综合管理(业务决策分析)等方面的深入应用。目标是利用新媒体、WEB2.0、数字化文化遗产技术、信息资源的组织等方面,对外全面提升首都博物馆开放式、自助式服务水平,对内加强各个业务方面的数字化管理,特别要充分挖掘文物价值提供文博研究专用系统、为提高综合管理水平提供业务决策分析专用系统等方面,提高数字化综合利用水平。