季梦佳(上海工程技术大学档案馆,上海,201620)
关于智慧档案馆中技术热研究的思考
季梦佳
(上海工程技术大学档案馆,上海,201620)
[摘要]技术建设一直是智慧档案馆研究的重点与难点之一,存在一些误解。文章首先概述智慧档案馆的理论研究与应用建设现状,指出技术研究与建设是当前智慧档案馆的热点。其次,分析对物联网、大数据两大技术的误解之处,指出档案实体物联化与档案信息化、档案的保密性与物联网信息共享的目标、档案数据的滞后性与大数据时效性等都存在偏离。最后,剖析智慧档案馆的建设误区,强调智慧化不等于智能化、数据化,指出理性智能与情感智能相结合才是智慧档案馆的发展之路。
[关键词]智慧档案馆技术理性智能情感智能大数据
1.1智慧档案馆的理论研究现状学术界对智慧档案馆的研究随时间的推移呈现出逐渐上升的趋势。目前,学术界有关智慧档案馆的研究主要集中在智慧档案馆的概念、智慧档案馆与数字档案馆的关系、智慧档案馆的建设、智慧档案馆服务四个方面[1]。笔者以中国知网学术期刊网络出版总库为文献来源检索库,以“智慧档案馆”为主题词进行模糊检索,检索时间不限,通过二次筛选,共有62篇符合要求。其中43篇为纯粹理论研究,7篇为混合理论研究,12篇为案例研究。在62篇研究文献中,频率最高的五个关键词分别为智慧档案馆、智慧城市、物联网、大数据、云计算。一方面,说明新一代信息技术在深入、全面应用后,给档案馆传统运行模式带来了巨大的冲击,推动档案馆转型升级,促进档案馆走向智慧化;另一方面,这也反映出学术界对物联网、大数据等信息技术的研究兴趣与关注热度愈来愈高。
1.2智慧档案馆的应用实践现状
在应用实践层面,青岛、杭州、张家港、太仓等区域的智慧档案馆建设呈现一片欣欣向荣的景象。青岛是国内第一个建设智慧档案馆的城市,2012年完成智慧档案馆建设理念、基本功能、系统框架及具体功能需求的研究工作;2013年提出智慧档案馆建设项目建议书;2014年,青岛市政府工作报告明确要求“建设智慧档案馆”,青岛市发改委将青岛市智慧档案馆项目一期工程列入市财力投资计划,同年4月完成项目招标,11月,完成项目建设,系统进入试运行阶段;2015 年5月26日,青岛市智慧档案馆项目一期工程通过相关部门组织的功能验收,正式投入试运行[2]。杭州以“杭州市电子文件中心”为基石,致力于打造智慧档案馆,将档案工作构建于互联网,通过合理分析为老百姓提供个性化档案服务,挖掘历史宝藏。目前已完成三期建设,基本达到了全市统一的电子文件系统规范管理和长久保存两大目标。即将启动的四期项目,将以全市档案信息资源为基础,通过政务云平台纵向连接各区县(市)综合档案馆,横向连接各市级机关立档单位和社会公众,提供跨馆查阅民生档案和开放档案等服务,逐步实现全市档案信息资源的整合和共享利用,实现管理模式的新突破[3]。太仓市档案局馆以物联网为基础,致力于迈入智慧管理时代。例如自主研制了自动化档案盘库车,在不需要从密集架中取下实体档案的前提下,通过盘库车自动清点档案数量,通过联动数字档案馆比对档案内容,既免去了传统盘库一卷卷人工盘点的繁琐,大大简化了档案盘库清点工作的流程,也能实现诸如区域定位、远程读取档案等一些特殊功能,从而使库房管理工作变得更高效[4]。
目前,智慧档案馆的建设热潮已经兴起,各个区域智慧档案馆的建设水平、建设重点又不尽相同。不得不承认,对智慧档案馆内涵以及理论研究的模糊,致使一些区域的建设只涉及智慧档案馆的某一部分,就堂而皇之地冠以智慧档案馆的光环,这种情况已经严重脱离了智慧档案馆的建设宗旨,势必对正在成长中的智慧档案馆建设造成影响。
2.1档案的属性与物联网的本质相悖
学术界对物联网迄今为止都没有一个公认的学术定义。研究型首倡者的缺失导致了很少有人去深入思考诸如“物联网的本质到底是什么”之类的理论问题(确切地说,是没有人提出引起争论的话题)[5]。在目前人们对物联网几乎一致的理解中,绝大部分学者仅从汉译的角度,将物联网解释成物物相连的网络。它将互联网技术的终端由传统的信息技术设备延伸和扩展到了任意物体,并使任意物体之间进行通讯[6]。这就容易引导人们走入对物联网的认识误区。第一,物联网就是物被连接的网;第二,物联网是一种新型的独立网络,和互联网是两种不同的网,两者彼此独立,但相互依赖。
首先,物联网是Internet of Thing的汉译,是谁在什么情况下将此翻译成“物联网”,现已无从考证。但如果从词语的语法结构及原本语义解释,Internet of Thing应该解释为“产品信息互联网”[7]更为贴切。因此,物联网中的“物”并不是指客观存在的物体或东西,而是产品信息。对产品信息的获取,主要是利用电子标签。电子标签其本身仅记录着产品的基本信息(确切地说是静态的索引性信息),可由其触发访问的“物联网信息服务器(IO T-Information Server)”动态地存储与该产品相关的全部信息[8]。现阶段,一些地区的档案馆在推广物联网技术运用的过程中,将档案实体物联化是最常见的做法。具体做法是在每份档案上加入RFID标签,赋予其特定的数字信号,通过自动化设备就可实时读取档案的信息,定位档案实体的位置。表面上看,这样不仅能降低库房档案管理的人力成本,更能极大地提高调档的效率,但也很容易出现问题。首先,将每份档案都黏上电子标签的可行性不高。现在我国正极力推行数字化,档案的利用也开始由实体向电子化转移。在未来,数字化档案、电子文件应该是档案存在的常态,所以将档案实体物联化的意义并不大。物联网的目标就是产品信息的全球范围共享,即每一位读取主体(人或可实现信息智能处理的机器)都能“读懂”其接收到的产品信息[9]。但就标准化情况而言,现状并不乐观。一词多义、一义多词的现象普遍存在,再加上术语标准的非强制性,导致各国、各区域的标准各不相同。这与物联网所要达成的目标相去甚远。
其次,物联网并未重新构建网络,而是完全依附于互联网,物联网与互联网本质上属于同一张网,物联网的运行离不开互联网,它是一种新型的互联网应用,一种基于互联网的产品信息共享方式[10]。既然是共享,那所有档案信息就必须开放。但实际上,档案具有机密性,人们的利用是有差异的,某些档案有关某一方面的内容,只能为某一层次、某一范围的人们所利用,超出这一层次和范围的任何知晓,可能会对其他人造成很大程度上的损害。因此,档案的机密性要求某些档案信息不能上网,而且要分密级程度保存。这与物联网的目标——产品信息的全球范围共享是相悖的。
2.2档案数据与大数据的本质属性偏离
与所有的IT概念类似,大数据的概念更像是一种特征描述,而不是技术领域的客观定义。目前,较为一致的观点是大数据具备“4V”特征,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。在档案学术界,大数据4个“V”特征在研究论文中随处可见。不得不承认,其中对某些部分的解读确有合理之处,但难免存在不同程度的概念泛化、夸大与误读。
随着档案数字化建设的深入,电子文件以及数字化档案的总体数据量在不断变大,有学者就牵强附会地认为档案大数据时代已经来临。但此“大”非Volume的“大”。从Volume的本义出发,它一般指的是聚合在一起可供分析的数据量必须是极大的,并且这个“大”主要是指由机器自动生成的数据量增长巨大,比如“引擎中内置的传感器,即使没有人触摸或者下达指令,它也会自动地生成关于周围环境的数据”[11]。对照这两点仔细推敲一下数字档案资源的特征。首先,档案数字化后,目前的数字档案资源主要分为两种,一种是传统档案载体的数字副本,另一种是电子文件。就前者而言,其数据量是十分庞大的,仅像第一历史档案馆这样国家级别的档案馆,其馆藏档案数字副本就可达数千TB;与此同时,原生电子文件的增量也在不断提高,十年前的中央机关的电子文件总量,就已突破TB。但这些海量的数字档案资源,80%左右的新增数据是“冷数据”“休眠数据”,这类数据的特点是静止的、固定的。因此这些非在线的冷数据,其总量可能非常大,但是增长速度与实时采集、动态获取的能力跟大数据所指向的相去甚远[12]。
大数据是现象,但“大”和“数据”都不是大数据中最重要的,大数据的核心是要挖掘数据价值,进行数据分析。数据分析要求的数据是全数据,档案能提供的是经过鉴定筛选后的数据,这与大数据的要求又背道而驰。另外,现代社会追求最大化的信息价值,数据的时效性又直接影响了信息价值的最大化。从技术特征上讲,大数据的突出优势就在于数据传输速度和接受速度是极快的、实时的,这就要求数据具有很高的时效性。档案是历史的真凭实据,具有极高的凭证价值和情报价值。然而,档案本身是历史的记录,是一种回溯性信息,再加上它有一个法定的封闭期,导致被人广泛利用或发挥作用需要一定的时间,具有一定的滞后性,档案信息的时效性自然相对较弱。
数字档案信息的形式日渐多样,从文本格式到图形图像格式,从图形图像格式再到多媒体格式等。但从目前的技术上看,数据分析仅仅在“爬虫”技术方面有所突破,开启了解读非数据结构化数据内容的一扇窗户。图像识别技术没有实质性突破,数据挖掘技术也停留在原来的水平,只是移植到云计算环境下而已,数据分析技术的突破与否决定着未来大数据在档案管理中应用能力的高低。
3.1理性智能与情感智能
理性智能与情感智能都是人工智能的产物,理性智能是人工智能的初级阶段,情感智能则是人工智能的高级阶段。理性智能是指从信息资源中获取知识,进行复杂的自然语言处理、学习、推理、规划及模式识别;情感智能是指在机器理性智能的基础上,通过对环境情景信息及人类情绪信息的感知、获取、计算和分析,实现以情感、情景智能为主的高级开发与应用[13]。
随着对智慧城市研究的深入,越来越多的研究者开始关注情感计算(情感智能)。其实,情感智能(情感计算)这个问题,在20世纪90年代初期就已被关注并开始研究。1997年,美国MIT媒体实验室的R.Picard出版专著Affective Computing,在书中正式提出情感计算(Affective Computing)的概念。所谓的情感计算就是试图赋予计算机像人一样的观察、理解和生成各种情感特征的能力。它试图创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统[14]。
智慧档案馆是Smart Archives的汉译。Smart的本义是聪明、敏捷、反应快,但并不包含智慧的意思。已经难以弄清谁是中文“智慧档案馆”的首倡者及其翻译依据。但“智慧”一词,在中国文化中含有更为丰富的内涵。智的特征是学习性,代表了人(物)的智商;慧的特征是创造性,代表了人(物)的情商。智慧档案馆包含“智”和“慧”两部分,即智慧档案馆兼具“高智商”与“高情商”。从一定意义上说,智慧档案馆可以称之为人工智能的产物。如果把“智”理解成理性智能,把“慧”理解成情感智能,那“智慧”就是指如何利用情感智能来更好地发挥理性智能。
3.2智能化不等于智慧化
档案馆引入物联网、大数据等高科技,这是智慧档案馆开始拥有高智商的表现。物联网为档案馆楼宇、人员等的智能化管理提供了基础,大数据又为档案个性化服务提供了分析前提。但这些最多只能称得上智能,智能并不等同于智慧。首先,关注点不同。智能仅仅关注的是每个智能项目的建设,是独立的,并且缺乏整体性的规划设计;智慧则关注每个智能项目之间的固有联系,有系统的规划与顶层设计,有统一的规范标准,并能从整体出发,嵌入式地搭建每个智能项目建设。其次,实质不同。智能技术强调的是软件资源,强调自动处理系统的贡献,更多是从技术角度关注档案馆建设;智慧关注机器的理性智能,更关注如何利用情感智能发挥理性智能的优势。再次,目标不同,智能以电子化、信息化为建设目标;但智慧则是要为人类提供更加个性化的智慧服务。从观念上讲,智慧档案馆追求的实际上是效益与人文的统一,兼具技术与人文的统一。最后,智能的结果只是数据的积累与传递;智慧在强调信息的采集与传递的同时,更加注重信息的交换、共享与挖掘。
3.3数据化不等于智慧化
档案的数字化是互联网出现以来一项重大的突破,数字化让档案信息的收集、管理与利用变得前所未有地容易。但新的问题也随之出现,即数字化的档案信息能否转化为一种生产力?大数据的出现让这一切成为可能,从数字化的档案信息中挖掘更具价值的数据成了档案工作的新方向。数据化主要包括数据的采集与数据的处理等工作,其实质是人类在信息传播、人际交往乃至日常生活的过程中,为了便于沟通、传播与保存,将一切客观存在均处理为数据,进而使得整个人类社会成为了一个庞大的数据库[15]。
数据化的最大特征就是以技术为中心,技术将不同国度、不同文化背景的人连接成一张巨大的网络,使得每个人(物)都以“数据化”的形式存在。但智慧化的最大特征是以人为本,用技术去为人提供个性化的服务。虽然这是一个数据主宰一切的时代,数据化与智慧化相互联系、互不分离,数据化为智慧化奠定了量的基础,而智慧化则是数据化质的飞跃,但数据化不等于智慧化。数据化使社会结构呈现出了以互联网为框架的数据化形态,而且使得传统的人际关系、信息交流变成了即时、迅捷的数据交换[16],但弊端也显而易见,就是容易使原本多元、立体的社会结构趋于单一、平面。况且一味地关注数据,就容易以理性思维取代感性思维,导致天平失衡。
首先,必须坚持技术与人文的统一。技术使档案工作不断朝着信息化、数字化、智能化、智慧化方向发展,但技术是一把双刃剑,正如技术哲学的研究者卡普所言:“所有技术当然也包括所有的未来技术,都只能被理解为人体的投影与延伸,是人体的外在化和客观化。”技术是智力的放大器,是人智力的投影仪,它让物具有了人的属性,可以说,技术本身体现着人的价值期望、价值追求,在技术设计、发明与应用的过程中,人的目的、价值观念就内化于其中。正因如此,技术要获得正确的发展方向,必须借助人文科学,为其提供动力、确定目标、端正方向,深化技术与人文的交融,智慧档案馆的发展才会欣欣向荣。其次,必须坚持情感智能与理性智能的统一。智慧档案馆的建设离不开理性智能,理性智能是打开智慧之门的金钥匙,为智慧档案馆的建设提供技术以及一切智力支持;情感智能则是智慧档案馆的发展方向,利用情感智能,正确协调与理性智能的关系,恰如其分地控制两者发挥各自的作用。总而言之,建设智慧档案馆,我们要走的路还很长。
参考文献
[1]巨珺.我国智慧档案馆研究述评[J].浙江档案,2015(4):6-9.
[2]http://www.qingdao.gov.cn/n172/n24624151/n24631595/n24631609/n24631637/ 150605161439540514.html
[3]http://hzdaily.hangzhou.com.cn/hzrb/html/2014-09/26/content_1808847.htm
[4]http://www.da.yy.gov.cn/art/2014/2/24/art_38730_1377081.html
[5][7][8][9][10]黄映辉,李冠宇.物联网:语义、性质与归类[J].计算机科学,2011,38(1):31-33,65.
[6]陈海明,崔莉,谢开斌.物联网体系结构与实现方法的比较研究[J].计算机学报,2013,36(1):168-188.
[11]Bill Franks.驾驭大数据[M].黄海,车皓阳,王悦译.北京:人民邮电出版社,2003:6.
[12]于英香.档案大数据研究热的冷思考[J].档案学通讯,2015(2):4-8.
[13]戴伟辉.情景感知与情感智能:通往智慧城市的智慧之门[J].上海城市管理,2012(4):29-32.
[14]解迎刚,王志良.远程教育中感情计算技术[M].机械工业出版社,2011:16.
[15][16]韩晗.“数据化”的社会与“大数据”的未来[J].中国图书评论,2014(5):26-32.
Reflection on the Research of Technology in the Smart Archives
Ji Mengjia (Archives of Shanghai University of Engineering Science,Shanghai,201620)
Abstract:Technical construction has been one of the key points and difficulties in the research of smart archives,but there are some misunderstandings.Firstly,the paper summarizes the theory research and application development of smart archives.Secondly,it analyzes the misreading of the internet of things and the big data.It is pointed out that the archives entity instrumented with archives informatization,confidentiality of archives with target of information sharing in internet of things,archival data lag and big data timeliness and so on.Finally,it analyzes the construction errors of the smart archives,emphasizing the smart is not equal to intelligence and datamation,pointing out that the rational intelligence with emotional intelligence is the development of the smart archives.
Keywords:Smart Archives;Technology;Rational Intelligence;Emotional Intlligence;Big Data
[分类号]G271
[作者简介]
季梦佳,女,上海工程技术大学档案馆助理馆员,主要研究方向为档案数字化。