刘佳慧
(山东大学历史文化学院,山东 济南 250100)
大数据理念下档案信息增值服务框架建构探析
刘佳慧
(山东大学历史文化学院,山东 济南 250100)
大数据理念下的档案信息增值服务框架以档案信息资源共享平台为基础,以数据挖掘和分析为关键点,以丰富的服务方式为渠道,以用户信息作为系统循环和优化的连接点,为用户提供档案信息增值服务。
大数据;档案信息;挖掘分析;增值服务
大数据理念下,档案信息内涵和服务方式都呈现出泛化特征,档案信息增值服务不只追求档案数据的大容量管理,关键是通过数据挖掘和分析实现档案信息价值增值,让各社会主题各供所有,各取所需,各尽所能,各司其职,借助人性化和个性化服务大平台谋求档案信息服务大发展。
理想状态下,大数据理念下的档案信息增值服务框架由档案信息集成阶段、档案信息增值阶段、档案信息增值服务阶段、用户作用阶段四部分组成,档案信息经多渠道集成至档案信息资源共享平台,再由不同社会主体进行数据挖掘和分析,最终为用户提供丰富的档案信息增值服务,用户信息反过来又成为数据挖掘和分析的对象,是推动整个档案信息增值服务循环运动的动力点和链接点。
档案信息资源共享平台的资源共享是具有职责性和相关性的共享。目前,档案信息资源共享从“信息传递”向“知识服务”转变、“供给导向”向“需求导向”转变、“大众服务”向“小众服务”转变。档案馆进行档案信息增值主要局限于馆藏资源的著录目录分析、内容联系分析及用户信息分析,增值服务方式以档案知识门户为主,较局限;政府及其他社会主体单位产生的可供挖掘分析的档案主要是专门档案和科技档案,如金融数据、环境数据、交通数据、医疗数据等,信息量大,种类多,组合分析的可能性大,增值服务途径将更加丰富。
档案信息资源共享平台是大数据理念下档案信息增值服务框架的基础。档案信息增值不仅是档案信息管理者自身进行增值活动,更多作为档案信息和数据源为更多的社会主体单位提供信息资源,便于交互性的数据挖掘和数据分析。
其一,扭转条块分割和自我封闭的档案信息储存系统。挖掘和分析档案信息潜在价值的基础性工作是建立一个跨地域、跨部门、跨行业、跨组织、跨学科、跨系统的档案信息共享平台,加强档案资源集群建设,提高多来源、多类型的档案信息资源的融合、类聚、重组的能力。
其二,践行“开放存取”的信息共享和交流机制。在保证信息安全和保障档案信息贡献者权益基础上最大限度地对外开放,档案信息资源贡献者非赢利的信息传播动机和利用需求是“开放存取”赖以存在的基本前提。只有建构开放性的档案信息资源共享平台才能广泛激发社会各种创新力量涌流,将大数据作为一种生产资料推动档案信息服务增值与变革。
其三,坚持标准化原则。异化的档案信息储存系统和平台在海纳百川的同时需在前端档案信息集成阶段确立统一、规范的标准以提高参与主体的效率效益和互操作性。尤其在电子文件盛行年代,元数据对于档案信息管理和数据挖掘、分析至关重要,实行统一和规范的元数据著录标准有助于档案信息的挖掘和分析。
档案信息挖掘和分析是连接并优化档案信息资源和用户间关系的关键环节,使加工形成的知识最终形成档案知识库。利用大数据技术实现档案资源与用户的双向循环控制的核心是档案资源、用户数据挖掘及相互关系、规律趋势预测。第一层面,社会行为主体从档案信息资源共享平台中挖掘所需信息和数据,并进行数据分析形成知识,然后提供或享受信息增值服务;第二层面,社会行为主体挖掘和分析用户的行为信息和反馈信息,从而调整档案信息挖掘和分析内容、类型、方向等,以此不断优化档案信息增值服务;第三层面,社会行为主体挖掘和分析用户的个人信息和行为信息,洞察不同事物背后的隐藏联系,科学预测社会需求方向和事物发展方向,从而创造新的档案信息增值服务。
档案信息增值服务本质是知识服务,不仅包括无偿的服务形式,在市场环境下的有偿增值服务形式表现出强大的生命力,服务渠道和领域主要有档案知识门户、市场变革、政府决策、公共管理与服务等[1],充分发挥档案信息资源的社会效益和经济效益。档案馆和政府是具有公共性质的档案信息增值服务的两大主体。档案馆主要通过档案知识门户提供档案信息增值服务;政府则主要通过政务决策实现自我服务,通过公共服务践行为人民服务的宗旨;高校、医院、企业等其他社会主体则主要挖掘和分析专门档案和科技档案,进行与自我作业和自我发展有关的档案信息增值服务。企业与市场是大数据理念下档案信息增值服务框架中最具活力的一个通道,泛化意义上的档案数据的增值服务已经在经济预警、市场营销、影视行业预测等方面引起了企业经营方式转变和市场变革,这种增值服务带来的经济效益是无法估量的,同时,企业利用大数据技术对档案信息进行增值服务政府,成为政府科学决策和优化政策重要的支持者。
用户是整个档案信息增值服务系统框架中的核心,更是整个系统得以不断循环优化的关键,其不仅是档案信息增值服务的对象,其产生的信息和数据也是挖掘和分析的对象。用户信息的作用大致可体现为三个方面:挖掘和分析用户反馈信息帮助档案信息服务主体优化增值服务、挖掘和分析用户个人信息和行为信息帮助洞察新关系和预测新需求趋势、用户利用潜在知识对档案信息知识库中的知识进行自我修改。外显性知识是客观的,易于交流和共享,而内隐性知识的共享和交流是一个高度动态化的过程,即知识是以动态化的形式存储在一个互动交流平台上,每个知识受用者都可以成为知识创造者,都可以对平台上的知识进行修改和完善[2]。从这个角度看,用户自身的隐性知识也将推动档案信息的增值,同时也享受其他用户提供的增值服务。
[1]林志刚,彭波.大数据管理的现实匹配、多重挑战及趋势判断[J].改革,2013(8):15-23.
[2]夏立新,韩永青,邓胜利.基于知识供应链的知识服务模型研究[J].中国图书馆学报,2008(3):63.
G273
A
1671-864X(2016)09-0290-01