席畅
(黑龙江大学信息管理学院 哈尔滨 150080)
大数据背景下档案文化功能探析
席畅
(黑龙江大学信息管理学院 哈尔滨 150080)
大数据时代的来临,使数据和信息分析上升到前所未有的高度。本文从大数据的定义出发,阐述了大数据的现实意义及内在价值,解析了大数据的应用对档案文化的功能所带来的挑战,同时提出了大数据的发展给档案文化功能带来的新机遇。最后指出了档案文化功能的实现必须建立在厚重的社会文化积淀、迫切的社会管理诉求和广泛的社会文化需求之上。因此,针对档案文化功能的大数据模式研究,将是档案学发展的关键。
大数据 档案文化 功能 探析
我们身处数据的海洋,每天都在产生数据。打电话、发短信、进地铁站安检、进办公楼刷卡、在QQ上聊天、上淘宝网购物……大量数据实时伴随着我们的工作、生活乃至社会发展。未来,数据必将成为人类重要的战略资源。档案作为国家发展的宝贵资源之一,文化底蕴醇厚与珍贵。大数据时代的档案文化功能转型,需要我们站在时代的高度,重新认识和对待档案的文化内涵,对接时代诉求,发挥档案文化功能的时代效能,是档案学界当今乃至未来需要深入研究和探讨的重要课题。
“大数据”和“海量数据”均来自英文,“big data”翻译为“大数据”,而“large-scale data”或者“vast data”则翻译为“海量数据”。从组成的角度看,海量数据包括结构化和半结构化的交易数据,还包括非结构化数据和交互数据。大数据由海量交易数据、海量交互数据和海量数据处理三大主要的技术趋势汇聚而成。
大数据的主要特征:一是数据体量巨大,从TB级别跃升到PB级别;二是数据类型繁多,如网络日志、图片、视频及地理位置信息等等;三是价值密度低,如视频,在不间断监控中可用数据仅有一两秒;四是处理速度快,即1秒定律。最后一点和传统数据挖掘技术存在本质不同。业内将其归纳为四个“V”——Volume,Variety,Value,Velocity。
大数据的相关技术实质就是“数据挖掘”和“辅助决策”。数据挖掘的焦点集中在寻求数据挖掘过程中的可视化方法,使知识发现过程能够被用户理解,便于在知识发现过程中的人机交互。
图1 大数据处理多层模型
利用大数据进行分析,能够做到总结经验、发现规律、预测未来,为辅助决策服务。数据信息的海量,使决策更加科学、精确与合理。数据在实际运用中产生无限的价值,其实际效果就是管理及决策水平有效提升,经济效益和社会效应显著增强。
广义上讲,文化是人类创造的一切物质产品和精神产品的总和。档案作为人类的历史记录和文化传承,是人类智慧的物态结晶,是宝贵的精神财富。丰富档案文化内涵,挖掘档案文化价值,扩展档案文化功能,不仅是推动档案现代化的内在需要,也是推动社会发展的迫切要求。档案文化功能扩展和转型面临着时代的挑战。
1.数据的海量增长挑战档案数据的存储能力。传统数据库追求高度的数据一致性和容错性,缺乏较强的扩展性和较好的系统可用性,不能有效存储视频、音频等非结构化和半结构化的数据。大数据时代档案存储手段得以扩展和变化,就大数据而言,它要求使用专用的数据存储设备和专门的数据库技术,克服了传统数据库的不足。目前,数据存储能力远远滞后于数据增长需求,设计合理的分层存储架构成为现代信息系统的关键。
2.全球的信息传播挑战档案信息传播功能。大数据技术的应用,特别是大数据特有的4V价值特性,使全球的信息传播如日中天、飞速发展。档案信息传播也随着人们日益增长的服务价值诉求和需求的多样性、复杂性,面临着巨大的压力和挑战。档案数据的处理和扩展,档案信息传播的法规、渠道、内容、安全等,需要系统性的设计和政策性的支持。
3.数据类型的多样性挑战档案文化的教育功能。作为重要的文化教育资源,档案具有原始、真实、权威及直观性特点,客观反映了社会生活的各方面,是文化宣传及教育的生动素材。大数据技术的应用,对档案文化教育功能提出新的要求,如何实现以往的信息采集、存储、分类、检索及人机交流等技术方法,顺利转换到大数据的管理和利用体系之中,达到有效转换和扩展档案文化教育功能,对档案学界来讲,必须深入探讨和研究。
4.数据跨越组织边界传播挑战档案信息的安全。大数据的出现,必将推动人类社会再上一个新台阶。但信息安全必然面临空前的挑战。大数据时代,各类信息巨量膨胀,需要保密或隐私的数据也迅猛增长,这就对数据存储的物理安全性、数据的多副本及实时应对机制提出更高的要求。档案作为大数据数据类之一,对瞬变的安全问题,关键看算法和特征,这就需要寻求和设计强大的安全防御体系,即时识别和发现安全漏洞,即时防御,以保证系统的安全运行。
5.数据处理的时效性挑战档案文化的传承功能。信息时代使档案数据的采集方式发生变化。在坚持以往传统采集模式的同时,大部分档案数据将从社会庞大数据系统中自动采集与生成,档案的知识生产功能必将得到极大扩展。档案作为文化载体,需要原始地保留人类文化的重要内容,它是历史记忆和传承的本源。大数据技术对信息处理有较高的时效性要求。而对于以往的数据挖掘技术来讲,当数据维度及规模增大时,需要的资源也将呈现指数的增长,面对历史有限资源,为了实现档案文化传承,在大数据运用过程中,就需要寻求简单有效的人工智能算法和面对新问题的有效求解方法。
大数据时代档案的文化功能存在两项重要的发展趋势,那就是“求真”和“求变”。“求真”是指作为人类活动真实记录的档案,具备原始性和真实性两个重要特性,它是人类历史发展的记忆宝库、知识宝库、信息宝库。而“求变”指的是档案管理、档案采集、档案文化传承的技术手段发生巨大变化,为了应对这如此多的挑战,档案的文化功能必须强化。
1.档案文化功能发挥的主体——数字档案馆的建设。数据复杂、海量、迅猛地增长,必将为档案的数据存贮能力快速提高提供广阔平台,数字档案馆的确立和发展,是弘扬档案文化的一个里程碑。作为集中保管和提供利用档案的公共文化机构,数字档案馆能以整体的形象向社会公众展示档案文化的存在价值。在大数据时代,无法对海量数据进行组卷,只能以“件”、“数据库”为管理对象,档案统计方面以“GB”为统计单位,还需要对每份档案保留检索、利用日志,避免档案信息泄密。数字档案馆的存在完成了档案文化功能的转变——即从组织文化向社会文化过渡。在这种新型的文化形态中,档案馆不仅要继承档案文化的传统优势,还要具备相当的文化兼容性,通过沟通和借鉴,使自己真正融人社会,使档案文化在此得以延续。
2.适合档案大数据开发的分析工具的研发。大数据时代档案文化功能即将面临的是庞大复杂数据的处理。如何高标准地深入挖掘档案文化信息,识别、采集、处理、生成数据档案面临巨大挑战。采用文档、图纸、音频、视频一体化数据中心管理模式,认真研究档案的内容、背景、元数据等归档的统一标准和运行方式,才能开发出适合档案行业特点的大数据分析工具。大数据的优势就在于信息数据建设不再局限于只针对结构化数据或单一数据,也不仅仅是数据库和XML等同类型,而是从非结构化或半结构化的复杂数据中挖掘正在发生的、同时分析和预测将来会发生的,以寻找、加工和生成有价值的档案文化数据,为更好地服务社会及应对未来的社会需求,扩展档案文化功能奠定基础。
3.实现档案文化功能的重要途径——档案文化产业的发展。档案文化功能的信息价值与大数据的发掘利用价值基本吻合。在档案文化产业发展中,档案部门对所有的开发资源进行统筹规划与安排,确定开发的时间和主次顺序,形成不同层次、不同规模的文化产品体系。要始终瞄准社会需求,摸清市场卖点,找准内容定位,选好实现形式,生产出人们喜闻乐见的产品,在求取良好社会效益的同时,带动经济效益的提升。档案的文化传承功能能够将涵盖信息获取、整理、组织及信息检索、分析、可视化等纯熟的理论、方法及技术应用到大数据之中,达到推动大数据研究和发展的同时,扩展档案文化的传承功能,以保证档案文化功能的信息价值和大数据的发掘利用价值做到双赢,并为继续生产出适情对路的文化产品积累经验、搭好架子、探索路子。
4.档案的文化传播功能与大数据有效契合。在档案大数据的实际运用中,我们在界定档案“Variety”范围时,不仅要关注档案大数据中的新型档案,同时还要关注数据档案的生命周期。要从档案信息源头着手,对档案数据实时地进行采集和处理,以确保档案信息的可靠性和完整性。“大数据时代”称之为大容量、大内容的数据集合时代可以说是当之无愧的。大数据的运用,使以往档案研究中的事实数据从获取渠道、数据内容与媒体形态等方面得到极大丰富,做到相互印证、相互补充,切实促进了档案质量和传统档案文化传播功能的共同提升。
5.人才结构向一专多能复合型的转变。档案工作人员对档案事业的发展起着决定的作用,从档案的收集整理到最后的编研利用,档案工作人员的素质决定了工作的质量。建立一支既具有较高档案专业理论水平,又具有相当计算机及外语水平,同时又具有一定判断力、管理能力和决策能力的复合型人才队伍将是数字化档案馆建设的重中之重。加强对在职人员的继续教育,引进高素质人才,优化人员配置,使每一位工作人员在适合的岗位上最大限度地发挥自己的能力。
6.档案文化信息安全手段、技术要进一步提升。“大数据”必备“大安全”,产出价值愈大,风险亦愈大。档案信息资源的开发和利用会涉及到档案信息的泄密、档案信息的丢失和篡改、隐私权的侵犯、知识产权的纠纷等问题,档案管理在运用大数据技术时需要注意这些潜在的风险。我们在档案大数据建设中,要把信息安全技术研究作为首要大事来抓,只有具备过硬的信息安全技术和手段,档案的大数据才能得以有效开展。
大数据的影响已波及到各领域,并将深刻改变人们的生产和生活模式。我们客观清晰地认识到,大数据的核心目的是在于为用户挖掘数据中蕴含的价值,绝不是软硬件简单的堆砌。档案文化功能的实现必须建立在厚重的社会文化积淀、迫切的社会管理诉求和广泛的社会文化需求之上。如何采集各类档案信息,丰富和完善档案文化功能,更好地分享和利用档案资源,切实发挥档案资源自身价值,是摆在档案工作者面前的重要任务,也是国家档案管理部门急需思考和解决的重要问题。
[1]任越.文化哲学视阈下档案文化层次问题研究[J].档案学通讯, 2016(1).
[2]席畅.信息文化背景下档案文化功能的转型探究[J].机电兵船档案,2016(4).
[3]席畅.信息文化对档案文化功能实现的影响[J].兰台世界,2016(5).
[4]席畅.大数据环境下未来档案馆建设的新构想[J].云南档案, 2017(1).
[5]贺德方.大数据环境下的情报学[J].图书馆学情报学,2013(3).
[6]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(5).
Analysis of Archives Culture Function Under the Background of Big Data
Xi Chang
(Information Management Department of Heilongjiang University,Harbin 150080,China)
The coming of big data era makes data and information analysis rise to an unprecedented historical height. Starting from the definition of big data, this paper expounds the realistic significance and the intrinsic value of big data, analyses the challenge as well as new opportunities to archives culture function brought by big data application, and finally points out that the realization of archives culture function must be based on massive social culture accumulation, urgent demands of social management and a wide range of social and cultural needs. Therefore, big data model research on archives culture function will be the key to development of archival science.
big data;archives culture;function;analysis
教育部人文社科规划基金项目“信息文明视阈下档案文化范式转型研究”(项目编号:12YJA870015);国家社科基金项目“信息文化视阈下档案价值认知转型研究”(项目编号: 13BTQ066);黑龙江省高校本科科研业务费黑龙江大学专项资金“智慧城市背景下档案信息资源规划研究”(项目编号:HDJDZ201613)阶段性研究成果。
席畅,黑龙江大学信息管理学院2015级档案学研究生。
G270.7
A
2017-02-28