付双双 钱万里 石峻峰
(1.苏州大学档案馆,江苏苏州,215000 2.南京航空航天大学档案馆,江苏南京,210016)
欧美国家进行网络信息资源采集与保存实验项目有:美国的The Internet Archive,MINERVA,英国的CEDARS,德国的NESTOR,澳大利亚 PANDORA, 挪 威 的PARADIGMA, 丹 麦 的NETARCHIVE,日本的WARP项目等[1]。1999年开始,英美高校与图书馆、档案馆、博物馆联合对数字资源合作研究,进行网络档案信息的整合与共享,简称LAM。它是一种分散,多元,以协会沟通协作的模式[2]。如GASHE 项目-“苏格兰高校档案信息资源整合门户网”。2002年“研究支持图书馆项目”以格拉斯哥大学为基点,整合苏格兰地区10 所大学档案信息资源。格拉斯哥大学档案馆与商务中心联手开发其档案。“RLSP”项目由爱丁堡大学图书馆和赫瑞.瓦特档案文件和博物处合作[3]。英国各高校采用统一著录标准,建立互通的档案资源交换机制。美国大学联盟和其它图书馆联盟联合构建,共同拥有馆藏并把资源编入研究性图书馆信息网,属于研究型档案馆。如美国密歇根大学本利特档案馆;耶鲁大学手稿与历史文件室,档案馆从业人员除管理档案还进行学术研究,讲学交流,是真正的文化机构[4]。哈佛大学档案馆并入哈佛图书馆,协调管理,共建共享。2002年初,由美国高校和历史协会,华盛顿州,西雅图市档案馆13 个机构共同建立的合作项目-美国西北数字档案馆(northwest digital archives),该数据库安装在华盛顿州立大学[5]。目前还有很多大学参与投资网络信息资源保存体系,已从以往的一次采集转变为事务型采集、深层网采集即数据库采集、LazyPreser2vation 即二次采集等多种方式。采集策略和方式朝多元化发展。采集内容覆盖人类社会的方方面面。网络信息资源存储系统技术和标准框架已日趋成熟,使用工具主要有两种,一种是PANDAS,一种是澳大利亚的PANDORA[6]。档案学理论研究方面,英、美、澳等国发表的相关论文数量和质量排在世界前列,发表论文数量和机构更以高校居首。论文主题,研究内容紧跟信息时代。
随着大学网络影响力的增强,大学信息数据量激增,对高校网络信息大规模、多种类数据的高速采集、存储归档、处理与分析以提取价值资源的技术架构与技术过程必须进行实践。高校网络信息档案建设的基础就是“网络信息数据采集”,它是指利用互联网搜索引擎技术实现有针对性、精准性的网络数据抓取,并按照一定规则和筛选标准进行数据归类,并形成数据库文件的一个过程。网络信息采集系统的特点是能支持海量数据智能化采集,具有支持各种网站,多种网页类型,多线层、多任务采集,文字、图片、附件、音频,视频等数据的压缩、存储,附件与正文自动映射与关联,压缩存储,可保存至磁盘或数据库。自定义表单,各种报表导出,自定义阅读模板,各种列表、内容分页自适应采集,集群采集,过滤,采集源管理,对采集来的信息进行二次加工。采集内容的自动排版,操作内容、操作人以及操作时间记录,图形监控网络使用情况、采集情况,采集到的信息可设置规则自动分类,转化为结构化的记录,保存在本地数据库中,用于内部使用或外网发布。
高校网络信息资源采集遵循原始性、全面性、真实性、针对性、时效性、筛选性、价值性和全程性原则。高校网络信息采集范围不大,但针对性、学术性、专业性强,学科面广,数据量大、类型多。采集资源保存和利用价值高。一是实时准确地采集指定的远程网站关于本校网页新闻,专题等信息内容,自动保存相关图片、视频和文本,进行标题、正文、发布时间、文章来源的多语言、编码格式自动识别。二是采集本校、院部网站的新闻,专题内容、行政、教学、学生管理等的文本文件;重要邮件、微博、博客、论坛帖子,教师的精品视频课程;大学的基建、设备、建筑、人物等的珍贵资料;教师公开发表的专业文章、科研数据、成果;集成各管理部门的在线学生学籍材料库、学生作品;学校人事、财务、学术活动、招生就业、学院特色、合作交流、校园媒体、公共服务、校园文化重要信息;采集档案编研成果,院部设置与变迁,名师、校友的网上信息;图书馆对研究生论文、教师专著,学术专业期刊已采集的,只共享就可。采集要对每类信息自定义来源与分类,记录唯一索引,避免相同信息重复入库。按照类型、发布机构、内容、层次、公开、内部等层次设定权限,并满足需求者随时获取信息。高校网络信息采集彻底颠覆传统档案管理模式,成为构建现代大学文化信息资源的重要支撑,保存、查找与研究IT—DT 时代高校发展史的宝贵资源,实现高校价值资源在社会空间有效整合与信息流共享。是DT 时代现代大学文化得以传承的重要条件。
我国网络信息采集与保存始于20 世纪末国家图书馆WICP 等项目。目前,网络信息数据采集,分析,发布系统软件有Web spider,Sitemap,Mete Seeker 等,但并不适合高校网络信息档案建设。目前我国高校不含独立学院有2500 多所。调研发现高校档案馆延续传统档案管理模式,未采用统一著录标准和建立互通的档案资源共享交换机制。内外网产生的大量有关学校,师生的重要信息,教学、科研、政务、学籍管理等大量信息数据库,很多已无法读取,视频精品课,部门数据库,校园网文化活动等都未归档。这些数据对教育管理、政策制定、社会需求、文化传承等具有重要价值。高校网络信息档案建设缺失已不适应时代发展。作为“数字校园”建设的有机部分——“高校数字档案馆建设”在技术、观念、理论研究和实践机制创新方面明显滞后。这种大学历史的断层,使未来人们不可能完整、全面、真实地重构这段大学历史。
通过一些期刊数据库输入网络信息档案进行中文核心期刊搜索,统计结果是关于网络信息资源的研究者大都是图书、信息或情报学专业学者,研究内容涉及网络信息资源特征、发展趋势、采集保存、搜集整合、管理策略、机制、分布规律、开发优化利用等。发表刊物多为图书馆学、情报学、科技发展类。档案研究论文数量和质量不到图书情报的十分之一,论文作者多来自高校档案专业教师。实际工作者缺少研究实践的积极性与高校对档案馆科研无要求,少经费支持,重视度不够有关。档案工作者日常性工作量大,理念保守,理论研究水平低,未成为网络信息建设研究的重要主体。
目前我国各大学,大学内图书馆、档案馆、博物馆都各自建设,和社会其它文化机构也少交流合作和资源共享机制。大学间,大学相关部门间网络信息资源协同创新,合作研究,联合开发模式没有建立。纸质和电子时代,高校档案馆建立了的“计算机档案管理系统”,“网络版档案管理系统”。DT 时代,高校档案馆无法对大学重要网络信息资源进行采集保存,不仅档案管理滞后,而且已失去档案管理的大部分功能。高校图书馆在网络信息资源采集、保存、服务等理论和技术方面做的很好,但图书馆没有采集保存档案的职能,管理范围和模式是图书、期刊、杂志、文献等有关的数据资源建设。许多高校为打造高校的文化名片,把重要历史文化价值的实物档案从档案馆抽出,建立校博物馆。形成三馆分立,各自为政。如果各部门进行网络信息采集,肯定有重复交叉。各大学,部门间管理标准和模式各异,现有的技术环境和系统界面不同,各高校“数字校园建设”要么没有考虑档案,要么把档案放在次要位置。建立高校网络信息档案集成式系统平台与协调机制难度很大。
高校网络信息档案建设宏观上要有大档案,大资源,大数据的系统理念。微观上要有智慧档案管理、价值挖掘和档案生态建设理念。这从构建网络信息档案系统平台“档案链”式工作模式—“数据信息归档—智慧档案管理—大数据信息分析—档案信息价值资源服务”得以体现。“档案链”具体指档案大数据系统自动选择并实时采集网络信息,为保持系统空间有效性,我们要进行信息价值甄别,重要内容随网页状态一起保存。针对目前档案泛数字化现象,要重视档案生态建设,对网络档案信息进行筛选保存并编目,通过网络将档案目录数据实时传送,形成逻辑上的目录库,并按档案类型、发布机构等对目录进行挑选重组、分层定位,实现输入关键词等在线目录检索和内容查找,形成的网络信息档案,系统默认为不可更改并加密处理供网上授权用户使用。档案工作者从海量数据中进行价值信息选择,并进行关联性资源挖掘,在数据分析基础上进行多方面研究,形成大学文化特色资源。
建设要注重学科交叉和知识溢出效应(knowledge spillover)大数据时代档案与其它学科交叉融合的特点更突出,这成为促进高校网络信息档案建设系统理论和实践创新的重要动力。档案从业人员专业应更宽泛,如计算机网络学科,历史学、文献学、文学、管理学、统计学、哲学、系统工程学、管理学心理学、数学、外语等。档案学研究应突破管理学范畴,延伸至社会大学科研究方向,这为档案学理论和实践借鉴吸收更多学科理论提供了条件,也使档案管理新理念在实践中有广阔空间和机遇。
建设要突出社会共享理念。档案载体从实物到电子,档案内容从普通资源到珍贵资源,尤其是大学优质网络课程、学术讲座、社团活动等应归档公开。网络新技术突破时空障碍,既异地用档,又扩大了知识和文化的传播空间。使许多渴望接受更多大学教育的社会人士在任何时点享受大学文化,这为缩小大学文化教育资源差距,尤其一流大学文化为社会,为学习者传播向往的大学文化提供了可能和便利。大学文化也丰富了社会文化并与社会文化形成良性互动,促进了社会进步。大学文化和精神成为公益性和共享性社会资源。
引入“社会—空间辩证法”理论。跨学科视角突破以往档案学理论研究(文件生命周期论、全宗论、价值论)的视野与内涵,引入“索加创立的社会空间辩证法”[7],从“社会—空间辩证法”角度研究大学档案建设,更好地阐释通过网络技术建立大数据档案信息平台,把大学实体空间生产的产品和网络数字档案资源和精神文化产品,通过虚拟网络空间的再生产向不同区域虚拟和实体空间提供大学档案文化信息。借助网络技术建构大学档案文化资源空间相互作用的纵向和横向结合的维度,突出网络信息档案空间性、社会性、历史性的三元辩证法,更符合现代大学档案和大学文化的“绝对空间”和“相对空间”的辩证统一,“实体空间”和“虚拟空间”的辩证统一,凸显历史档案信息在空间、时间的流动性。形成空间的信息流,这反映了马克思主义的“不同的人类实践怎样创作和利用了不同的空间概念”来表达档案资源的绝对空间,相对空间和关系空间的辩证统一。在此理论指导下的高校网络信息档案建设对于发挥大学文化的社会和空间价值,实现大学文化间和各种社会文化空间共生,交流碰撞意义重大,更为大学发展和社会发展注入文化创新动力。
引入“共生理论”[8]。“共生”源于生物学,“共生理论”应用在人类学、社会学、经济学、管理学、医学,建筑学等很多领域,本质就是“协同”。大数据时代技术和档案资源结合,档案与网络“共生理论”这一新的研究视角更能提升大学档案文化资源在社会空间中的重要作用。在尊重每所大学的地缘文化和传统文化前提下,高校间,高校与其他机构间,社会间网络档案信息协同建设与资源共享为异质大学文化间相互交流,融合与碰撞提供了重要理论支撑,研究角度可以从高校档案及社会文化的“异质文化共生”,“文化与技术共生”,大文化的“内部与外部共生”,大学的“历史和未来共生”等方面进行研究。
把空间的因素引进来,以共生的理论为指导,不仅对高校,也对所有档案建设管理实践与理论研究都有重大意义,尤其能促进“档案运动动力理论—价值理论”的新发展。
平台建设。社会空间共生理论为档案学科理论和实践提供了支撑。技术为建立高校网络信息档案集成管理系统大数据平台提供了可能。借鉴成熟的系统建设项目和标准,如OAIS 模型。它的互操作性适用独立、合作、联合型等多种类型数字档案馆信息集成。它完整的档案信息保存功能模块,包括接收具有特定格式,真实、完整的信息包;选择恰当的存储媒体,判断存储级别、采取不同安保措施的归档存储以及灾难恢复。清晰的信息模型结构有利于数字信息的长久保存。目前OAIS 应用主要在图书馆界,我国一些档案馆已经建立基于OAIS的数字档案馆,但实践中没有采取联合、协作、共享的策略和统一标准[9]。借鉴成熟研究理论和项目进行高校网络信息档案集成管理系统大数据系统平台设计,对与本校有关的价值信息、网页、电子邮件、媒体、论坛,数据库、业务系统或其他数字技术所产生的原始信息进行采集存储。内容包括文字、图像、音频、视频等,并进行信息汇集、甄别、存储、分层定位、智能检索、分析管理,实现超大规模数据库的信息集成,并且最大权限开放档案。利用大数据进行统计分析研究,实现用户个性需求。技术成熟后再进行高校间档案系统群建设,有效整合共享各大学档案资源。所以技术流程和元数据标准,业务流程管理规范,制定网络信息收集归档保存原则,包括信息类型系统分类、安全存档和使用、信息采集和使用的法律原则等都显得非常重要。
机制创新。目前一些高校在档案馆、校史馆、博物馆进行档案信息一体化建设方面已部分先行,如华南理工大学、北京交通大学、上海交通大学等,但并未与高校图书馆等部门进行合作共享。DT时代,在大数据,大资源、大档案理念下,高校应打破部门管理壁垒,首先考虑高校档案馆与图书馆,博物馆三馆合一,协作共建,优势互补,统筹管理,与其它社会机构合作,集中人才、技术、资金等力量建立数字资源整合的研究机构和团队。采用统一著录标准,建立跨部门、跨业务的共建互通共享的信息资源交换机制,更高层次是高校在“数字校园”基础上建立全局性统一的信息资源和数据采集标准、交换共享互操作分析平台。突出网络信息资源采集归档集成管理系统,把档案馆系统定位在外网信息采集归档和校内外网络信息的智能选择分类归档,资源的分析和利用研究上。这是DT时代现代大学网络文化发展的趋势。试点成功后,再进行高校间网络信息资源系统群建设,节约研究和建设成本。
队伍建设。高校网络信息档案建设是一项系统工程,档案管理需要复合型人才:培养技术型系统建设维护和安全使用平台的网络信息人才,选择采集价值网络信息档案人才,网络信息档案法律人才,网络信息档案鉴定人才,进行档案数据挖掘、统计和分析人才,网络信息档案文化研究人才等队伍建设。
[1]丁丽鸽.《国外网络信息资源保存研究及其对我国的启示》[J].《科技情报开发与经济》.2007(25).
[2]肖希明,郑燃.《国外图书馆、档案馆和博物馆数字资源整合研究进展》[J].《中国图书馆学报》[J].2012(3).
[3]颜川梅.《浅谈英国高校档案信息资源的整合与共享》[J].《山西档案》[J].2008(3).
[4]朱江.《研究型档案馆——美国密歇根大学本特利历史图书馆考察记》[J]《档案与建设》[J],2005(2).21.
[5]于丽娟.《国外数字档案馆建设概况》[J].《中国档案》.2003(3).
[6]杨程.《网络信息资源保存发展现状及趋势分析》[J].《信息与电脑(理论版)》.2012(08).
[7]叶超.《社会空间辩证法的由来》[J].《自然辩证法研究》[J].2012(2).
[8]黑川纪章著.(日)覃力等译.《新共生思想》.中国建筑工业出版社[M].2012-08.
[9]王艳丽.《我国档案界对OAIS 参考模型的研究和应用》[J].《档案管理》.2009(4).