杨智勇 周枫
摘要:文章首先分析了智慧城市建设中五大领域的数据来源,并从系统视角构建出智慧城市数据资源体系图;然后按档案生成主体,主要从机关团体、企业机构、个人与家庭、网络媒体四个方面介绍数字档案资源的来源;最后结合智慧城市的特点,指出政府开放数据、IT企业数据、社交媒体文件将成为数字档案资源建设应着重关注的领域。
关键词:智慧城市数字档案资源开放数据
Abstract: First the article analyzes the data sources of five areas of smart city construction,and builds a smart city data resource system map from the system perspective. and according tofor? mation of archives, the article mainly introduces the source of digital archives from Organ groups, business organizations,individuals and families, on? line media.Finally combined with the characteristics of the smart city,Points out the key areas of digital archives resource construction are government open data, IT business data and social media files.
Keywords:Smart city;Digital archival resourc? es;Open data
数字技术的应用和智慧城市的发展将人类带入全新的智能时代,智能时代的显著特征是智能技术广泛应用于生产、生活、经济、科学、文化、教育等社会各个领域。在智慧城市的发展背景下,信息技术和网络技术的应用在提升档案服务功能的同时,也产生了海量的数字档案资源,这些数字档案资源生成环境各异、种类多样、结构复杂、管理分散。本文重点梳理了智慧城市背景下数字档案资源的生成环境及来源状况,以期为数字档案资源的全面收集、科学整合和有效利用提供参考。
一、智慧城市中的数据来源及其资源体系架构
智慧城市是从城市信息化理论的视角提出的城市化的高级阶段。从技术上看,信息技术的创新和综合运用是智慧城市的基础,物联化、互聯化和智能化构成了智慧城市的技术特征;从对象上看,政府机关、企业机构、社会组织和市民大众既是智慧城市的主体,又是享有智慧化服务的客体对象;从业务上看,智慧城市是这样两类业务开展的集合,即原有业务的智慧化升级和跨领域业务的融合创新;从功能上看,智慧城市提供了居住生活、产业运行、市政组织等各方面的应用,这些应用分散于城市的各个角落,但又被信息通信网络有机地组织起来;从信息本身的生命周期看,智慧城市是一个完整体现信息价值的过程,通过识别、感知、传输、互联、序化、分析与挖掘等一系列行为,使数据抽象为信息,信息提炼为知识,知识升华为智慧。[1]
(一)智慧城市中的数据来源
智慧城市主体要素是空间环境、城市物理形态和经济社会形态的现实构成元素,是一个城市最基本的组成,包括城市基础设施、智慧政府、智慧经济、智慧社会、自然环境五大部分。而智慧城市的数据来源也主要来自于这些方面。
城市基础设施是城市生存和发展所必须具备的工程性基础设施和信息化基础设施的总称,其数据来源主要是由这些基础设施自动生成,比如工程设备、机器设备、摄像头、传感器、计算机、移动设备等各种机器设施产生的数据。
智慧政府是指利用信息技术和现代管理方法,提高政府办公、监管、服务、决策的智能化水平,形成高效、敏捷、便民的新型政府,其数据来源除了现已掌握的人口、交通、卫生、社保、税收、城市规划等各类数据外,还有其在电子政务过程中形成的各种业务数据、调查数据、管理数据和用户数据等。
智慧经济的载体是智慧产业,智慧产业是数字化、网络化、信息化、自动化、智能化程度较高的产业,其数据来源主要是各级各类企业在研发设计、生产制造、经营管理、市场营销、资金流转等各个环节形成的数据。
智慧社会是指高度智能化的社会,其数据来源包括两个方面的内容:一是社会事业的智能化数据,比如智慧教育、智慧医疗等;二是市民生活的智能化数据,比如智慧社区、智慧家居等。
自然环境是自然界存在的天然物质与能量,它既是人类生存和发展的基础,又是环境要素,其数据来源一是对环境状态的感知、监测形成的数据,二是对自然环境保护、管理形成的数据。
(二)智慧城市数据资源体系架构
从信息发展和系统构造的角度出发,智慧城市具有全面透彻的动态感知、宽带泛在的互联互通、协同共享的高度集成、智能融合的广泛应用,这些特征有助于我们描绘一个理想的智慧城市数据资源体系,如图1所示。
智慧城市的数据来源广泛、结构多样,除了已有的各业务系统的数据以外,还有来自物联网、互联网等的实时、非结构化数据,因此需要不同的数据交换方式以接入这些异构数据。根据数据的特点存储在不同的数据库,根据应用服务的需要进行数据融合处理,并通过“动态感知、网络互联、信息共享和业务协同”的中间支撑能力,为上层各个业务系统的智慧应用和智能服务提供数据基础。
由上图可知,数据资源体系是智慧城市中各种数据资源的集成,包括前置业务数据库、物联网数据、流媒体数据、业务系统数据、互联网数据等。数据资源体系不断集成各式各样的数据,并把它们转化为统一标准的数据“累积”下来,并统一以资源的形式进行信息的管理与组织。具体包括:基础数据资源库、共享数据资源库、特定数据资源库、公共服务数据资源库、管理数据资源库和政府决策数据资源库。基础数据资源库包括人口数据库、法人单位数据库、自然资源和地理空间数据库、宏观经济基础数据库;共享数据资源库支撑市民卡、数字医疗、综合治税、行政审批、数字城管、应急指挥、城市规划、辅助决策系统等典型智慧城市应用;特定的数据资源库是为满足特定使用者的目的形成的,比如卫生服务、社会保障服务、国土资源监测、财务审计业务所涉及的特定数据资源库等;公共服务数据资源库包括四大类:基础公共服务数据库、经济公共服务数据库、社会公共服务数据库和公共安全服务数据库;管理数据资源库包括城市基础地理数据库、公共设施数据库、公共产品数据库、公共信息资源数据库、人力资源数据库、自然资源数据库、公共项目数据库、社会问题数据库等;政府决策数据资源库包括国家经济数据库、国家自然资源数据库、行业规划数据库、产业政策数据库、金融数据库、财税数据库、工商数据库、产业解决方案数据库等。[2]
二、数字档案资源的主要来源
数字档案资源是国家机关、社会组织和个人产生的具有保存价值的数字档案信息。数字档案资源来源广泛,形式多样。按生成主体,主要有政府机关、企事业单位、社会团体、家庭个人等在社会活动中形成的各类数字档案。
(一)机关团体
根据《机关文件材料归档范围和文书档案保管期限规定》和《各级各类档案馆收集档案范围的规定》,各级党政机关和人民团体是档案资源的主要来源。这些组织机构包括:中国共产党委员会及所属各部门、人民代表大会及其常设机构、人民政府及其所属各部门和单位、人民政协及其常设机构、人民法院、人民检察院、各民主党派机关、工会、共青团、妇联等人民团体和事业单位等。这些组织机构形成的主要文件材料包括:反映本机关主要职能活动和基本历史面貌的,对本机关工作、国家建设和历史研究具有利用价值的文件材料;机关工作活动中形成的在维护国家、集体和公民权益等方面具有凭证价值的文件材料;本机关需要贯彻执行的上级机关、同级机关的文件材料;下级机关报送的重要文件材料;其他对本机关工作具有查考价值的文件材料。
(二)企业机构
根据《企业文件材料归档范围和档案保管期限规定》,各级各类企业也是档案资源的重要来源。这些企业机构形成的主要文件材料包括:反映企业在研发、生产、服务、经营、管理等各项活动和基本历史面貌的,对企业各项活动、国家建设、社会发展和历史研究具有利用价值的文件材料;企业在各项活动中形成的对维护国家、企业和职工权益具有凭证价值的文件材料;企业需要贯彻执行的有关机关和上级单位的文件材料,非隶属关系单位发来的需要执行或查考的文件材料;社会中介机构出具的与本企业有关的文件材料;所属和控股企业报送的重要文件材料;有关法律法规规定应归档保存的文件材料和其他对企业各项活动具有查考价值的文件材料。
(三)个人与家庭
《全国档案事业发展“十三五”规划纲要》提出未来五年发展目标:档案资源更加齐全完整、丰富多元,覆盖人民群众的档案资源体系更加完善;档案信息整合共享程度明显提升,档案利用服务更加便捷普惠,方便人民群众的档案利用体系更加完善。可见,民生档案将是档案资源建设中非常重要的组成部分,而家庭和個人档案记录了普通大众的生活,真实反映了底层社会变迁,其内容具体、形式多样,是民生档案资源最富活力的部分。个人或家庭在社会活动中形成的档案大致可以分为:政治经济、文化生活、亲历重大事件三类。政治经济方面的档案如党派证件、职务职称、各种票据、房产土地契约、收支记账簿、秘方等;文化生活方面的档案如结婚证、老年证、手稿、书信、日记、族谱等;重大历史事件方面的档案如拍摄的照片或录像,口述记录,某些重大历史事件的第一手资料往往来自老百姓。[3]
(四)网络媒体
随着互联网技术和现代通讯技术的快速发展,人类对信息资源管理逐渐向网络信息资源管理阶段演进。与传统信息资源相比,网络信息资源具有表现形式多样、增长迅速、传播方式动态化等特点,同样是日后人类社会宝贵的文化遗产。从“大档案观”角度思考数字档案资源建设,有保存和利用价值的网络信息资源将是未来大数据时代数字档案资源极其重要的来源和组成。从档案来源角度,网络媒体主要可以分为两大类,一类是网站,一类是社交媒体。
1.网站
网站是指在因特网上根据一定的规则,使用HT? ML语言等工具制作的用于展示特定内容相关网页的集合。简单地说,网站是一种沟通和展示工具,人们可以通过网站来发布自己想要公开的资讯,或者利用网站来提供相关的网络服务。网站信息资源具备以下特点:以网络为传播媒介,信息以网站为载体,以虚拟化的状态展示给人们;这些信息资源的数据总量非常大,增长速度也异常快;传播方式不受时空限制。从档案部门扩展数字档案资源角度考虑,有重要保存价值的网站信息资源包括政府网站、机构网站、国有企业网站、大型门户网站和重要人物个人网站。
政府网站,其建立主体是国家、省、市、县一级政府,它们在响应信息化建设后建立了这些综合性质的应用系统和信息平台,网站信息涉及政府新闻、政务信息、政府政策、法律法规、规章制度、统计数据及资料查询、技术标准、政府电子出版物、政务通信交流、政民互动信息及其他反馈信息等。政府网站信息是对政府行政情况和过程的全方面记录和反映,同时也涉及一些人们社会活动的原始记录,这些原始性的记录具有较高的权威性,具备一定的凭证价值,可以作为数字档案资源的重要来源。
机构网站主要指公立学校、科研院所、医疗机构等建立的官方网站,这些机构网站的开通代表着较高的权威性、官方性,其发布或形成的网络信息具有高度的可信性。这些网站发布了最新的国家部门政策,记录着各类事业单位的发展状况,网络信息平台共享并产生着众多业务办理信息,它们随时都产生着人们社会活动的各种原始记录。
国有企业网站记录并展示着本企业的产品、经营管理模式、业务范围等信息,及时更新着产品或服务的相关情况,开设的信息交流平台实时记录了企业与用户的交流反馈信息等,这些信息都是整个企业发展历程的有效记录。
大型门户网站主要指新浪、腾讯、搜狐、网易、百度、人民网、新华网等,它们为所有互联网用户提供全天候的信息资讯。这些网站中更有“非典记忆”“汶川地震”“美国911事件”“北京奥运会”“上海世博会”等国内外重大事件的信息版块,记录着这些重大事件始末,满足人们不论事件过去多久都能随时查阅事件全貌的信息需求,它们记录着中国乃至世界的发展历程。
重要人物个人网站是指拥有极大影响或社会威望的公众人物开通类似博客的个人网站,他们通过发布文字、图片、音视频等形式来表达自己对政治、经济、文化等各类社会事物的看法和见解,通过写日志记录个人经历与人生历程等。这些高质量的网络资源都是其个人所形成的原生性信息记录,体现着这些重要人物的自身性格特点与思想,同时也从侧面反映出社会某一阶段的现状,这类网络资源也是数字档案资源较为有益的补充。
总而言之,网站信息资源无论是从内容还是数量上都十分庞大,它涵盖政府、企事业单位、社会大众等各类实践活动的方方面面,同时又不同于以往传统档案的保密性,它本身具有公开性和可获取性。如果将网站信息资源纳入数字档案资源体系,将大大有利于丰富和完善档案资源结构,从而保存更为完整的历史记忆。
2.社交媒体
移动互联网和web2.0的发展推动了社交网站、微博、微信、博客、论坛、播客等社交媒体的发展,普通公众参与的信息自发传播使社交媒体在政治、经济、文化生活等领域中占据着越来越重要的位置,同时也推动了档案资源的社会化。在新的时代背景下,档案资源的来源、载体、形式等都发生了变化,汇集大量信息的社交媒体成为获取有价值的档案资源的新平台,而此类档案资源的特征是:没有严格和统一的格式,具有广泛的社会性和参与性,是一种交互信息的记录等。它的表现形式可以是图片、文字、视频、音频,也可以是以上任意两个或两个以上资源的组合。同时,社交媒体平台上产生的具有原始记录性和保存价值的信息,既具有传统档案的本质属性原始记录性,又具有其一般属性:社会性、历史性、确定性,还具有一些特殊属性即时性、文化性、知识性、政治性、教育性等。[4]因此,社交媒体也将成为数字档案资源建设必不可少的重要来源。
三、智慧城市建设中数字档案资源来源的重要补充
当今时代档案资源建设最大的机遇和挑战是数字档案资源的崛起,它将成为档案资源体系架构中的新元素和重要组成。在实体资源和数字资源共同支撑档案资源大厦的时代,数字资源的采集和完善无疑是档案资源结构的重要补充和丰富。然而,根据现行规则,每一个档案机构实体资源的收藏范围是基本确定的,而数字资源则没有明确的边界,很大程度上是谁建设谁拥有[5]。智慧城市涉及智慧政府、智慧经济、智慧社会三大领域,这三大领域在建设和发展过程中,会产生和形成大量的数字资源,其中有相当一部分数字资源可作为数字档案资源的采集范围。除了《电子文件归档与电子档案管理规范》规定的电子文件归档范围外,智慧政府对应的政府开放公共数据、智慧经济对应的重点企业数据资源、智慧社会对应的网络媒体信息资源,将成为智慧城市建设中数字档案资源来源应着重关注的领域。
(一)政府开放公共数据
开放数据是指任何人都可以访问、使用和共享的公共数据,具有可获取性、机器可读性、免费、不受限制的特点,是经过开放鉴定并且在政府开放许可范围内的,不受著作权、专利权等的限制,可以面向社会公众开放与自由获取。开放数据既是智慧城市建设的要求,也是实现城市智慧治理的资源要素。[6]麦肯锡全球研究院研究表明开放数据现象虽然是近年来才产生的,随着众多技术的进步,开放数据将更具有现实意义并越来越盛行,开放数据正在成为“新常态”[7]。开放数据最早出现于2007年欧盟的“欧洲激励计划”中,目前已经成为英美诸国进行开放政府和智慧城市建设的重要内容。2010年以来,随着英国政府公布数据集方式的演变,英国国家档案馆通过UKGWA捕获和保存政府机构网站所有形式的内容(包括网页、官方出版物、数据集、多媒体等网站信息)及元数据(比如形成时间、形成者等),积累形成了丰富的数字档案资源库。[8]目前我国的政府信息在公共数据开放过程中正稳步推进,档案部门根据其职能职责,可从整合各类公共数据资源入手,在保障国家安全、商业秘密、知识产权、个人隐私的前提下,全面采集并整合各类政府开放的数字资源。[9]
(二)重点企业数据资源
伴随着互联网、云计算、大数据的飞速发展,人们在生产生活的诸多方面如生产制造、物流交通、电子商务、医疗卫生、社交媒体、生物科学、资源环境、教育文化和公共安全等方面形成了大量的数据信息,而与之相关的重点企业形成并积累了这些海量信息。同时,随着智慧城市的深入推进,也使一些重点IT企业的数据资源成指数级增长。比如,阿里巴巴、百度、腾讯等IT企业已经形成并存储了海量的数据信息,尽管这些数据信息都掌握在这些IT企业手中,但其中很大一部分都是由一个个用户产生的,如社交媒体上用户发布或交互的信息、用户网上购物的消费记录、使用搜索引擎的搜索记录和用户消费数据等,这些数据资源既是企业的档案资源,也是社会的档案资源。因此,档案部门要加强与这些重点企业(尤其是重点IT企业)的交流与合作,通过对其档案资源建设工作的指导和监督,实现某些公共档案资源的共建共享,从而推动档案部门对这些重点企业数字档案资源的有效把控。
(三)网络媒体信息资源
随着移动互联网、Web2.0和智能手机的普遍应用,以官方网站、社交网站、社交媒体为主的网络媒体在智慧城市大背景下蓬勃发展,人们越来越热衷于通过网络媒体创造和传播信息和知识。网络媒体的广泛使用使得用户在其平台上产生了大量的数据信息,包括普通公众的工作和生活记录、企事业单位的业务活动、政府部门的工作动态等一系列信息,其中有真实记录、公共传播和社会记忆等长远保存价值的网络信息资源将是数字档案资源归档保存的重要选择。它们作为档案保存下来,不仅对人们了解、认识和考证重要网络事件或社会活动具有直观、快速、可参考的凭证作用,而且对记录城市发展、群体记忆、社会生活具有重要的保存价值。目前,国外图书档案界已经开始收集归档网络媒体文件,在网站及在线出版物归档方面,1996年瑞典皇家图书馆设立网络信息资源收集项目Kul-turarw3,2001年挪威国家图书馆开始实施网络信息保存项目PARADIGMA,2003年英国6个具有影响力的机构组成联盟提出英国网络信息保存联盟计划(UKWAC)实验性项目,2002年北京大学图书馆网络实验室主持开发了“中国Web信息博物馆”系统,2003年中国国家图书馆也正式启动网络资源的采集与保存试验项目;[10]在社交媒体信息归档方面,2010年美国国家图书馆开始对Twitter存档,2012年美国北卡罗来纳州建立社交媒体归档利用平台,2012年澳大利亚国家图书馆开始对博客网页进行选择性地归档汇总,2014年英国档案馆向公众提供在线的社交媒体库,2014年加拿大国家图书档案馆也创建了Canadiana项目,加强数字化文献遗产的归档和在线利用。[11]2016年國家档案局发布的《全国档案事业发展“十三五”规划纲要》中,提出要研究制定重要网页资源的采集和社交媒体文件的归档管理办法,这也将有效推动社交媒体文件的归档和保存工作,从而丰富和完善我国的数字档案资源体系。
*本文为国家社科基金青年项目“智慧城市与数字档案资源建设研究”(项目编号:14CTQ036)的阶段性研究成果之一。
注释及参考文献:
[1]郭骅,苏新宁.智慧城市信息资源规划研究[J].情报理论与实践,2016(9):47.
[2]李光亚,张鹏翥等.智慧城市大数据[M].上海:上海科学技术出版社,2015:53-69.
[3]王萍,丁华东.论体制外档案资源的构成与特点[J].档案管理,2012(4):9-12.
[4]王亚肖.浅谈社交媒体对档案工作的影响[J].档案学研究,2014(2):47-49.
[5]冯惠玲.档案记忆观、资源观与“中国记忆”数字资源建设[J].档案学通讯,2012(3):4-7.
[6]吕颜冰.智慧城市框架中的数字档案资源来源[J].浙江档案,2016(1):24-27.
[7]How government can promote open data and help unleash over $3 trillion in economic value[R].New York:USA. McKinsey Global Institute,2014:23.
[8]赵玉,王健.英国国家档案馆在线社交媒体档案库及其特色[J].档案与建设,2015(12):35-36.
[9]宁宇龙.“大数据时代,档案部门应勇担重任”——访全国人大代表、农工党湖南省委专职副主委蒋秋桃[N].中国档案报,2014-03-14(1).
[10]周耀林,赵跃等.面向公众需求的档案资源建设与服务研究[M].武汉:武汉大学出版社,2017:236-240.
[11]郭俊卿,黄新荣.国外社交媒体文件的开发利用研究[J].档案,2017(4):47-48.