文 / 苏君华 宋帆帆
数据治理视域下的档案微信公众平台研究
文 / 苏君华 宋帆帆
文章从数据治理角度,以385个档案机构微信公众号为研究对象,对微信公众平台的数量分布、数据质量以及数据安全进行实证性的调查,发现大部分微信公众号存在着问题,在此基础上,提出了强化数据意识、健全数据标准以及增强安全监管技术等具体策略。
数据;数据治理;档案微信公众平台
数据治理(Data Governance)是大数据背景下产生的一个新型领域,受到国内外研究机构的关注,学者们从不同的角度阐释了对“数据治理”的理解。Informatica认为,数据治理是建立一个决策和跨职能章程,用于创建数据治理政策、流程和标准,以提升组织数据资产的价值。[1]ROBERT F. SMALLWOOD认为,数据治理涉及数据清洗,剔除损坏的、不准确的或无关的、重复的数据,以消除数据的冗余。[2]国际数据管理协会(DAMA international)认为,数据治理是对数据资产管理行使权利和控制的活动集合。[3]国际数据治理研究所 ( The Data Governance Institute,DGI)认为,数据治理是指针对信息相关过程的决策权和职责体系,这些过程遵循“在什么时间和情况下、用什么方式、由谁、对哪些数据、采取哪些行动”的方法来执行。[4]百度百科则认为,数据治理是指从使用零散数据变为使用统一主数据、从具有很少或没有组织和流程治理到企业范围内的综合数据治理、从尝试处理主数据混乱状况到主数据井井有条的一个过程。除了受到研究机构的关注外,“数据治理”也获得了以数据为核心业务的银行、保险、电信等行业的重视,并产生了很多应用成果,如中国银行业所制定的“数据治理与数据标准”和《银行业监管统计数据质量管理良好标准》[5]等。同样作为以数据为核心业务的档案界却至今没有动静,鲜有学者涉及到该领域的研究。
本文采用实证性调查的方式,以数据治理理论为指导,从档案微信公众平台的数据数量分布、数据质量以及数据安全三个维度探讨其所面临的问题及未来发展的方向,挖掘其价值,实现其服务创新与价值创新。
2017年1月至2月笔者采用登录手机微信,通过点击“发现”→“添加朋友”→“查找公众号”→“搜索公众号”,在搜索栏输入“档案”,搜索到385个档案机构微信公众号,其运营机构涉及个人、企业以及高校三部分。调查范围包括档案微信公众号的质量、数量以及安全。
据2016年微信数据报告显示,企业、自由职业及个体户以及学生所占比例分别为:40.4%、25.3%、14.4%[6]。三类微信用户的比例总和达到八成。而我国档案馆微信公众号开通的最早时间是2013年底。经过短短几年的发展,取得较好的成绩。一方面,省级微信公众平台数量在不断地增加。于2013年完成微信认证的只有一个即浙江省档案馆,到2017年2月为止,全国省级档案微信公众平台增加到17个。另一方面,除省级档案开通微信公众号外,一些市级、区级、县级也已经陆续开通。例如,嘉兴市档案局于2017年1月24日完成微信认证,上海市浦东新区于2016年12月16日完成微信认证。虽然总体呈上升趋势,但数量仍然较少,且我国东、中、西地区明显分布不均。据笔者调查,我国省级档案微信公众号(港、澳、台除外)中,东部地区除海南省之外的11个省已经开通了专门的省级微信公众号;中部地区只有山西、安徽、湖北3个省开通了公众号;西部地区10个省、直辖市、自治区中仅云南省、四川省、贵州省3个开通了公众号。
微信公众平台的质量是评价公众号优劣的一个重要指标,也是衡量用户参与度的重要标准。我国档案微信公众号质量层面呈现以下几个特征。首先,数据的更新频率方面,整体不太理想。如“南京档案”在微问数据上平均更新周期为7天,其WDI指数(通过对该公众号近期的阅读量、点赞量、评论量及发布习惯、周期等等因素进行综合评分,评分越大,代表该公众号整体质量越佳)为32。[7]而“上海普陀档案”平均发布周期为3天,WDI为439[8],应该说在当前信息传播日新月益的大环境之下,这种数据的更新速度对用户难有吸引力。其次,档案描述的精确性方面,差别很大。如“浙江档案”的版面设计分为“浙江档案”、“记忆浙江”以及“档案服务”。“浙江档案”包括“微门户”、“微博”、“新馆建设”,侧重于档案与新媒体的链接。“记忆浙江”包括“浙江之最”、“记忆浙江”、“乡音的呼唤”、“乡村记忆”以及“微相册”,侧重于本地的特色档案,与用户产生共鸣,促进档案利用。“档案服务”包括“查档须知”、“预约查档”、“网友留言”、“网友投票”“联系我们”,更侧重于档案的基本情况以及与用户的交流,其总体设计还是比较精准。与之相比的“安徽档案”则显得过于简朴。最后,数据的标准不一,一方面,结构化数据与非结构化数据并存,另一方面,大部分档案微信公众号都存在着非结构化数据的内容、大小、格式、用途完全不同的现象。
数据已经成为数字时代最重要的资产,据IDC预测,2020年全球数据总量将超过40ZB,其中80%为非结构化数据[9],数据安全成为现阶段人们必须考虑的问题。目前互联网上出现了一些从数字治理角度出发而设计的“治理工具”,如Storify、Scoop.it、Bagtheweb、Pearltrees、Bundlr Pinterest 等[10]。据笔者对我国385个档案微信公众号实际调查情况来看,绝大多数档案微信平台并没有设置“安全管家”等安全措施,这使得在档案微信公众号平台上传播的信息具有不少安全隐患。一方面,档案微信公众号推送给用户的信息中包含着大量的数据信息,包括馆际互借和文献传递数据、规范数据、用户个人信息等数据。这些数据是在其生命周期的生成、传输、存储、处理以及共享等环节中运动,其中由于网络自身原因或者人为原因难免会出现纰漏,数据的流失轻则导致档案价值的减损,重则导致数据无法恢复,给用户以及企事业单位造成经济损失。另一方面,微信发展依赖于网络技术,而网络技术由于自身的不安全性、不稳定性,数据的丢失、无法登陆等现象时有发生。公众号存在的数据以及系统的不安全,直接导致关注度的降低,公众丧失访问的途径。
数据类型的多样性以及数量的丰富性、复杂性给用户带来了挑战。如何从庞杂的数据中选择所需要的,如何保证数据在传输、共享等环节的安全问题等困惑,使用户在实践操作中感到迷茫。首先,应该从上至下加强认识。我国顶层设计已经注意到数据治理将会带来效益。2015 年5 月,在巴西圣保罗召开ISO/IEC JTC1/SC40 WG1 工作组会议上,中国代表提出了《数据治理白皮书》国际标准研究报告,经过国际专家会上讨论,通过工作组表决,同意由中国国家委员会正式提出新工作项目申请[11]。各级档案管理人员应该将这种精神落实到档案微信公众平台的运营中去,应该从上到下、从内部到外部加强对数据治理的重视,保证在系统建设、系统运行、系统维护各个环节都能重视数据治理。其次,加强培训和继续教育。由于微信受众广、传播及时以及包含的数据类型丰富等特点,因此需要各主体具有较高的信息素质。一方面,档案馆各部门应该进行数据治理的培训,使档案工作者和数据治理者树立数据思维,例如,档案微信订阅号可以每天推送一条数据微传播,潜移默化地增加受众者的数据意识。另一方面,要营造良好的数据治理氛围,档案各部门通过微信公众号加强对数据治理的宣传、推广,创建一个“用数据说话”的局面。
微信公众号的数据标准应该健全,这是其数据质量保障的前提与基础。首先,应建立健全统一的数据标准。不仅要定义出一套在业务和信息技术层面必须遵守的数据标准,更要将这套数据标准真正地执行、落实到各个层面,并为制定全面的标准化管理流程和今后的管控、维护提供依据。其次,要明确职责。为了实现整个全局性数据统一协同的目的,就要明确定义数据与其所有者、相关利益者的关系,明确决定“谁”拥有这些数据、“谁”又用“何种”方式授权“哪些”人员使用某些数据。而档案微信公众号应包括管理人员、业务人员和技术人员,各人员各司其职,共同维护数据的安全,即管理人员应由档案馆的领导、技术负责人和业务负责人共同组成,负责制定数据治理的方针、政策等大局情况。业务人员应由专门的业务专家、业务部门系统管理员组成,负责管理业务系统参数、业务基础设施的维护等运行工作,而技术人员应包括数据开发人员、数据治理人员以及数据库管理员等,负责数据的录入、备份、安全防范等工作。总之,各部门各司其职、各干其事,共同维护档案微信平台的运行。
在数据共享、数据开放的大趋势下,数据隐私成为各行各业最大的关注点,档案事业尤其如此。首先,要在体制上建立健全微信安全的标准规范,将微信安全纳入法律法规的范畴,建立微信隐私权的保护;要在技术上建立信誉机制。信誉机制是一种防御机制,一般通过主机的信誉度高低来评估一台主机的好坏,使得网络中其它主机在通信时尽可能选择信誉度比较高的主机,避开恶意主机,避免遭受攻击,防止隐私的泄漏[12]。其次,加强数据监管。通过搭建数据质量监控平台可以实现数据质量自动检查、监控,平台包括数据质量检查规则库、规则执行引擎、数据质量报告、报告推送功能[13]。如德国数字图书馆( DDB) 发布的应用程序接口( API) 可将所有馆藏数据实施开放获取和数据重用,用户通过API 可以更容易地重用自由共享的DDB 文化遗产数据[14]。此外,我们还应引入数据治理审计,对数据治理过程进行综合鉴定与评价,向微信管理人员提出问题与建议,促进数据治理目标的实现。
数据从表面上看是“冷冰冰”的,似乎无任何实际的意义,但是在特殊的场合中,其背后隐藏“暖暖的”人情味。此时,它是记忆的载体,是历史的重现,是活的灵魂。而数据治理在我国是一个新型的行业,并未得到管理者的高度重视,在档案界尤其如此。因此,档案管理者应该注意数据治理在预测、决策等方面的重要作用,科学地推进数据治理进程,充分与利益相关者、技术人员进行沟通,保证他们的话语权,增强与他们的互动性,充分发挥档案预测未来,保留历史的作用。
[1]全局数据治理:实现竞争优势的框架[EB/OL].https://www.informatica.com/content/dam/informatica-com/global/amer/us/collateral/white-paper/holistic-data-governance-framework_white-paper_2297.pdf
[2]ROBERT F.SMALLWOOD,information governance :concepts strategies and best practices[M].Wiley.2014.
[3]DAMA International.Dama International.The DAMA Guide to the Data Management Body of Knowledge[M].Technics Publications,LLC.2010.
[4]Data Governance Institute.The DGI Data Governance Framework[R/OL].http://www.datagovernance.com/the-dgiframework/dgi-framework.pdf.
[5]数据治理打造银行新竞争力-银行频道-和讯网[EB/OL].http://bank.hexun.com/2012-12-18/149186023.html
[6]艾瑞咨询:2015年微信公众号媒体价值研究 | 互联网数据中心-199IT | 中文互联网数据研究资讯中心-199IT.[EB/OL].http://www.199it.com/archives/358369.html
[7]南京档案(njdangan)_微问数据[ER/OL].http://wewen.io/analysis/njdangan
[8]上海普陀档案(shpt_archives)_微问数据[ER/OL].http://wewen.io/analysis/shpt_archives
[9]黄海峰.华为发布数据治理的宏大愿景[J].通信世界,2016(15).
[10][12]祝智庭,陈丹.数字治理:智慧学习新素养[J].电化教育研究,2014(9).
[11]张明英,潘蓉.《数据治理白皮书》国际标准研究报告要点解读[J].信息技术与标准化,2015(6).
[13]高亮.数据治理:让数据质量更好[J].中国教育网络,2014(12).
[14]Open GLAM.German Digital Library releases API[EB/OL].http://openglam.org/2013/12/04/german-digital-libraryreleases-api.
G270.7
A
1005-9652(2017)03-0041-03
本文系江西省高校人文社会科学研究规划基金项目“信息治理视域下档案服务质量优化研究(项目批准号:TQ1511)”的阶段性成果。
(责任编辑:虞志坚)
苏君华,南昌大学人文学院教授,博士;宋帆帆,南昌大学档案学专业硕士研究生。