孙立红
(中国移动通信集团内蒙古有限公司,内蒙古 呼和浩特 010000)
随着大数据时代的到来,我国科技的腾飞,呈现出社会信息化,也推进了企业信息化的发展。近年来,云计算的兴起,数据应用日益广泛,网页作为必不可少的传播形式正以惊人的速度发展。多元化的信息发布及信息应用也以网页的形式展现,网页已成为当下最受追捧的信息传播方式。特别是现代企业,运用云计算技术,把网站网页作为对内高效管理、对外提供服务的重要窗口与桥梁出现在大众视野里。与此同时,出现了大量具有凭证、考查和保存价值的网页文件,成为企业在新网络时代发展中不可或缺的重要记录。积极探索企业网页归档新路径,留存企业数字记忆,积累企业历史文化财富,丰富企业数字档案资源,发挥企业档案价值,服务企业未来,提升企业管理竞争力具有十分重要意义。如何有效进行企业网页归档,已成为现代企业档案工作的新课题。
网页归档已逐步引起国家重视,相继出台政策,对政府网站网页归档进行规范化管理。但从企业经营管理角度来看,人们普遍认为,实现企业网页归档需要从技术、设备设施、人力方面长期的不断投入,短期内看不到回报,增加了企业的经济负担,是一件费力不讨好的事,得不到企业足够的重视,忽略了企业网页归档的价值。
许多现代企业仅仅完成有限的电子文件归档管理,对企业网页归档未建立起一套完整的涵盖收集、保管、利用的管理模式,制度建设不健全,没有形成完善的企业档案管理体系,致使许多有价值的网页以及网页上的图片、音频、视频无迹可寻。企业网页归档从管理制度上得不到有力的支撑和保障。
有的企业现有档案管理系统开发技术陈旧,与现阶段的成熟技术存在一定差距,数据来源单一,电子文件资源管理受限,维护成本偏高,已不适应现代企业信息管理的需求。档案管理系统架构不支持网页归档的要求,不能有效扩展个性化功能模块,制约了企业网页归档进程。
网站信息具有经济价值、文化价值、历史价值和研究价值。一个网站代表了一个企业的门面,是企业实力的象征。不管企业规模大小,都会借助网页展现企业的品牌形象。通常情况下,一个企业都会建立网站的,有的企业甚至会建立多个不同特色的网站。每个网站是由多个网页组成的,因此,企业网页承载着海量具有较高价值的信息资源。人们通过网页信息,便可了解企业的基本信息。
早在1999年“政府上网”工程启动,我国政府网站发展迅猛。2016年中共中央办公厅、国务院办公厅印发了《国家电子文件管理“十三五”规划》,提出推进政府网页及电子邮件、音视频等电子文件归档的要求。2017年国务院办公厅印发了《政府网站发展指引》,明确了对原网页进行归档处理。2018年国家档案局下发了《国家档案局办公室关于确定网站网页资源归档试点单位的通知》,明确了企事业单位网站网页归档的试点单位。2019年国家正式发布《政府网站网页归档指南》,对网页归档作了明确的要求。2021年中共中央办公厅、国务院办公厅印发了《“十四五”全国档案事业发展规划》,提出加强国家档案数字资源规划管理,大力推进“增量电子化”,促进各类电子文件应归尽归,电子档案应收尽收,为企业网页归档提供了理论依据。
企业网页本身是动态的,网页会根据需要经常更新,不断推陈出新的内容自然会将陈旧的内容慢慢覆盖掉。当人们想了解一下过往时,那些重要信息往往已不知去向。特别是随着时间的推移,当企业经营管理出现变革时,新的网站建设会把原网站遗弃、忘记,导致大量企业网页文件信息的遗失,无从查找。因此,真实反映和再现企业网站原貌,满足企业网页信息的长期保存并提供利用服务,已成为现代企业不容忽视的基础管理工作内容。
网页归档是指将网站中对国家和社会具有保存价值的网页信息进行收集、整理、移交接收的过程。企业网站网页内容多元化,涉及企业的生产、经营、科研、管理等内容,是传统纸质档案的补充与再现。企业网页归档管是一种特殊的电子文件归档。将网页文件纳入电子文件归档保存范畴,实现电子文件规范化管理,进一步丰富企业档案资源,完善企业档案信息资源体系,为企留史,成为加强企业档案工作的重要举措。
随着我国互联网、云技术、大数据应用的不断普及,企业信息化建设也逐步覆盖到各个业务领域,电子文件的归档管理已相对成熟。企业理应紧跟时代步伐,顺应时代新要求,开拓管理新理念,提高认识,与时俱进,提升企业信息管理能力。特别是企业信息技术部门,在为企业网页信息维护的同时,要配合档案部门的工作需要,支持本企业网页档案的形成及归档,共同维护企业档案信息资源的完整与安全。
根据国家及档案行业标准,制定本企业网页归档工作制度,明确相关部门工作职责,梳理网页归档范围及保管期限,明确采集时间、归档文件格式、整理规则,规范数据的管理、保存及利用,对网页归档进行统筹管理,加强前端控制,推进企业档案管理制度建设,完善企业档案信息化管理体系,促进企业网页归档工作顺利开展。
以《企业数字档案馆(室)建设指南》为指引,以企业档案管理需求为导向,依托现代云计算、大数据技术,搭建新型企业数字档案信息系统,增设网页归档模块,采用网络技术手段实现网页归档文件,保障归档电子文件的及时性、完整性、可用性、安全性,满足海量级网页电子文件的采集、保存、整理与利用,从网络层面、系统安全及应用软件层面确保“三同步”安全管理。
遵循《电子档案管理系统基本功能规定》中的相关要求,捕获和记录企业网页信息及网页信息归档过程的元数据,完善目标网页采集、元数据管理、网页电子文件捕获、网页的版型处理、网页电子文件阅读、在线阅读、文件检索、文件打印、网页归档服务、大数据分析服务以及微信公众号采集等功能,采用WARC技术标准作为网页存储和展示的基础技术标准,采用OFD技术标准作为网页归档的离线技术标准,可通过时光轴的展示形式,将已归档的网页以归档的历史日期为入口,重现不同历史时间点上采集下来的网站信息,提供高效、精准的企业网页档案利用服务。
随着自媒体企业级微信公众号、微博、头条号、抖音号、App等形式的应用推广,同样也出现大量包括文字信息、图像、动画、音视频等内容记录着企业风貌和社会记忆的重要电子文件信息。同理可将每个网络信息的Html页面及其资源文件直接采集下来,存储为WARC格式,再定期根据电子文件管理的生成要求生成ODF格式文件进行归档保存,多维度地留存和再现企业的社会记忆,避免信息黑洞。
网页归档分为两种方式:①采用网站服务进行主动归档;②采用网页抓取技术进行被动归档。针对新建或升级的网站,要在网站系统建设时即要求建立网站系统提供归档功能,实现主动归档。对于已有网站,需通过网络爬虫技术被动归档,提高网页归档的成功率。
档案信息资源是反映历史的一面“镜子”,将企业网站网页、自媒体企业级微信公众号、微博、头条号、抖音号、App形成的有价值的信息纳入档案的管理范畴,实现对网页电子文件从采集、归档、存储到利用的全生命周期管理,极大地丰富了企业的档案信息资源,拓宽企业档案管理范围,为企业各项工作、活动提供有效的信息利用服务支撑。
①增强了企业管理基础工作能力,促进企业内部协同发展。②明确企业档案管理的不同角色、不同职责、不同权限,职权清晰,分层管理。③完善了企业档案制度建设,实现档案信息管理规范化、制度化、程序化,保障信息数据的高质量。④提升企业档案信息化管理水平,搭建新型企业档案信息管理平台,实现企业信息资源的集中化管理,并可通过一站式服务,提供企业档案资源利用高效化及信息共享。⑤优化了企业档案人员知识结构,有效提升了档案人员的专业性、知识性、工作能力,以适应企业现代化管理的需求。
企业是否可持续发展,取决于它在市场中的竞争能力。竞争力虽然包含很多种因素,但信息是其重要的成因。企业若能在日益激烈的竞争中取得主动权,立于不败之地,就得及时掌握大量准确的信息资源。企业网页电子文件作为企业电子档案的重要组成部分,真实记录着企业的发展过程和发展成果,积淀和贮存了丰厚的知识量、信息量,在企业生产、经营、管理及科研等活动中发挥了重大作用,减少企业无畏的经济损失,在特定时刻产生经济效益,提升企业管理竞争力。
企业档案即要维护企业利益,也能解决社会问题,在促进社会进步中发挥着重要作用,具有社会效益。企业网页归档,可将档案资源转化为社会生产力,拓展企业档案利用服务的新模式,拓宽企业档案利用服务新渠道,营造多维度的档案利用服务氛围,实现企业档案的社会价值,此外,企业可充分发挥网站网页窗口展示作用,利用云端、大数据等技术,面向社会提供企业网页真实的历史信息,为社会服务。
大数据时代的到来,数字技术的不断完善,已把档案信息融入互联网,使档案资源得到无限扩展。丰富企业档案资源,挖掘企业档案信息,助力企业可持续发展,对企业档案工作提出了更高的要求。国家档案局局长陆国强在《2020年全国档案局长馆长会议上的报告》中表示“‘十四五’时期档案事业将着力服务经济社会发展”“档案工作要更加聚焦高质量发展,更好地顺应人民群众对档案工作的期待,以走向依法治理、走向开放、走向现代化为引领,推动档案大国向档案强国转变。”企业应用发展眼光,开拓进取,站在时代前沿,把握现实信息,提升企业竞争力。运用大数据手段,推动企业档案信息化建设,提升档案管理能力,服务社会、服务未来,为档案强国助力。