大数据时代博物馆资源发现的挑战研究

2015-12-11 21:55
互联网天地 2015年8期
关键词:博客检索博物馆

田 园

(故宫博物院 北京100009)

1 引言

数据是信息系统运行的基础和核心,也是机构稳定发展的宝贵资源。随着信息系统数据量呈几何级数增加,特别是在当前大数据环境和信息技术快速发展的情况下,博物馆数字资源的数量和维度日益变化,大数据时代具有的特点如数据容量大、数据增长速度快和处理速度快、数据类型丰富、海量数据中有价值的数据占比小等,都使快速、准确地发现资源成为博物馆面临的现实挑战。

本文以故宫博物院的数字资源管理为研究案例,以如何从大数量、异构的数据集中发现有价值的、准确的数字资源为切入点,提出了在大数据时代资源发现遇到的关键问题及其应对策略。

2 博物馆面临的新挑战

故宫博物院是明清紫禁城建筑群与明清皇室旧藏文物为基础的文化艺术品的收藏、研究和展示机构。院藏可移动文物总量达180余万件(套),分25个大类别,69个小类别,其中,一级藏品8 000余件(套),二级藏品620 000余件(套);不可移动文物——古建分成40个区域,单体建筑980座,堪称艺术的宝库。

对于现代博物馆,数字资源与实体资产具有同等甚至更加重要的资源价值。故宫博物院因其丰富的藏品,产生了数量众多、内容丰富的藏品相关资源,涵盖了照片、历史文档、档案、视频、图纸、书籍等多种资源类型。为了便于管理和利用各类数字资源,先后建立了文物管理系统、古建信息管理系统、影像资源系统、图纸资源系统、历史文档系统、档案管理系统、音/视频管理系统、包含25种数据库的电子阅览室等。这些结构化数据和非结构化数据每天都在快速增长,因此,如何从快速增长、数量庞大、各种渠道产生、各种载体承载的数据中找出所需要的资源,将资源转化成知识,成为当代社会博物馆面临的新挑战。

3 博物馆资源发现的解决方案

以研究建筑为例,同某个建筑相关的资源数据十分丰富,涉及建筑历史,包括修建历史以及明代和清代在这里发生的事件;建筑结构,该建筑所使用的建筑材料以及工程做法;建筑匾额,从该建筑上的文字(包括满/汉文)可判定其悬挂时代。建筑里涉及的内容更多,例如,建筑原状陈列的绘画方面涉及挂画、通景画1通景画的结构非常巧妙,一般分为四屏一组、六屏一组、八屏一组不等,相互连接为一幅统一的场景。如宫倦勤斋内170 m2的绢本重彩通景画卷覆盖墙面,郎士宁的弟子王幼学等人绘制。全景画在几张大的丝绢上,覆盖于四壁及穹顶,通景画穹顶是串串藤萝,融中西画法为一体,既有西方的透视感,又具有中国的写意性。、壁画、贴落2贴落是统绘画的一种装潢方法。四边镶绫边,类似于今天的镜心,但不加镜框,而是直接裱糊于墙壁或槅扇。等;法书方面涉及对联、题字等;建筑内家具上摆放的青铜具、玉石、漆器、文房等;此外,还有地毯、隔扇等;有的建筑内还涉及佛堂、戏台等。

因此,现在博物馆的资源发现早已不是通过检索一个门类即可完成的工作,要从中找到所需要的、有价值的资源,必须采用新的方法。由于藏品的数字资源采用不同的平台、不同的数据结构和实现方式,这对于快速、准确地发现有效资源是很大的挑战。针对上述问题,笔者提出了定制RSS(Really Simple Syndication,简易信息聚合)发布新资源、资源整合、主动推送相关资源、构建学科博客、构建微信群、数据词典、友情链接、提供语言工具支持等几种解决方案。

3.1 定制RSS发布新资源

RSS是一种Web信息推送技术,可以按照使用者的要求将预定的信息推送给他。

利用RSS服务,用户可打开RSS阅读器,点击已定制的RSS频道,可以直接浏览定制页面的最近更新内容。博物馆用户可以根据自身的信息需求、文物专业、研究方向、科研进展等进行RSS定制。该解决方案的突出特点是:定制RSS发布新资源的简单描述说明可以极大地降低博物馆信息发布成本,有效提高发布的时效性和针对性,为用户提供有针对性的服务。

3.2 资源整合

由于存在许多异构的数字资源系统,并且每个数字资源的加工方式千差万别,加大对博物馆数字资源深层次加工的力度,可以将现有许多系统的数字资源进行整合,实现跨数据库同时检索。资源整合建立在对博物馆资源的分析基础上,对资源进行分类,将资源的属性内容等进行分析、归类和深层次加工。资源整合必须按照不同研究内容进行分类整合,例如,将资源分成明史类、清史类、书画、青铜、陶瓷、古籍、建筑等组合,便于直接推荐给相关研究人员。整合资源数据时,还要发现其相关联的信息,如一个历史人物的字号、官衔、地域、亲属关系等,这些将给用户提供极大的方便。

3.3 主动资源推送

主动资源推送建立在对博物馆资源的分析和对用户的分析基础上。对博物馆用户的分析可以让用户填写一般情况,如用户专业、研究方向等,也可以通过统计一定期限内用户检索资源的行为,发现用户的检索规律。例如,博物馆用户登录古建信息管理系统后,系统记录下其浏览查看资源的内容和频次,就可以对其行为趋向做出一般的行为数据分析结果,然后可以将这些结果存入该用户的属性集中,如果此用户再次登录该系统或其他资源系统,就可以为该用户推送满足其属性集中条件的资源,这种方式即主动资源推送。

主动资源推送可以自动跟踪用户的资源使用情况并主动传送相关信息,因此,主动资源推送必须建立在数字资源整合的基础上,实现一种资源主动找人的模式。通过提取资源的信息特征,构建资源整合模型,主动让用户浏览相关资源的信息,让用户及时了解专业领域的相关学术信息,为用户动态地提供有价值的资源。

3.4 构建学科博客

博客本是互联网上一种具有个人色彩的信息服务工具,可及时交流信息,聚集起热门话题的讨论。

针对博物馆数字资源构建学科博客,并通过用户之间互相访问彼此的博客,评价讨论现有的数字资源,提供新的数字资源来源等。构建学科博客不仅可以宣传博物馆现已开发建设的数字资源,还可以评价哪些资源的建设比较完善、适用性强,哪些资源的建设尚存缺陷,能够帮助博物馆挖掘更多、更好的数字资源。

构建学科博客,也可以为不同领域的研究人员和专家提供在线交流和沟通的平台。各个学科之间相互渗透、相互关联,但任何一个研究人员或专家都不可能精通所有领域的知识,因此,构建学科博客,可以使不同领域的研究人员和专家进行有效的沟通、交流和协作。

博客由于在学术观点、思路、方法以及学术成果表达方面受到的限制较少,因此,更具有交流思想与共享知识的意义,可以作为博物馆界交流渠道的有益补充,大大扩展了信息的来源渠道,方便用户快速了解和掌握博物馆界最新的学术动向和馆际之间的工作动态,还可围绕专家形成一个虚拟的专业性社区,对热点、焦点问题提出独特见解,加快学术思想的传播,帮助青年工作者更快地获得更多高水平的反馈与解答,完成业务和学术的启蒙和教育,潜移默化地带动业务水平的提高,推动和促进博物馆的人才培养。

3.5 构建微信群

微信是目前大众使用的频繁、快速交流的工具,可通过网络快速发送语音、文字、视频、图片等,并支持多人群聊。按照不同的研究方向或具体的研究内容设置相应的微信群,既可以在该微信群中发表最新消息和重大成果,又可以让其随时产生思想的火花,在不断的交流中碰撞。将微信群定位成高门槛、小众化的小社群,群内成员已经有一定的联系、共通的知识基础、一致的行内准则,借助微信打破地理空间上的隔阂,让交流更加便捷。通过微信群实现人与信息的聚合,同时,高门槛的小社群更容易保障交流的专业化程度。

3.6 数据词典

为了提高检索的广义和深度,提供检索词的相关词典,并请用户扩充词表,做成开放在线词典以提高资源被发现的机会。例如,检索词“乾隆”的相关词可以有 “清高宗”、“弘历”、“宝亲王”、“十全老人”等。

3.7 友情链接

当本馆资源不能满足研究需要时,重点推荐其他博物馆或研究机构的相关资源以及检索方式,提供相应链接以便研究人员较快速地实现资源的检索。

友情链接中还应包括推荐相关领域的重点专家以及他们的联系方式,以便研究人员能及时得到相关专家的指点和引导。

3.8 语言等工具支持

资源的类型多种多样,也是多语言的。例如,许多清朝档案的内容以满语构成,还有些档案内容只有满语版,因此,提供语言工具支持才能更好地解读资源。

4 结束语

随着社会发展进入大数据时代,博物馆的生存环境也发生了巨大变化,面临着前所未有的挑战,也给博物馆的发展带来了新机遇。博物馆只有适应社会发展,利用自身的资源优势开展更高层次的资源发现服务,才能提升博物馆的服务水平,为博物馆的可持续发展贡献力量。资源发现是一个挑战,也是一个更好地实现博物馆功能的机会。

[1]杨九龙.RSS技术在图书馆信息服务中的应用[J].情报探索,2010,(2).

[2]王丹丹.图书馆引入、实施Wiki的障碍分析[J].图书馆学研究,2011,(3).

猜你喜欢
博客检索博物馆
CNKI检索模式结合关键词选取在检索中的应用探讨
博物馆
瑞典专利数据库的检索技巧
2019年第4-6期便捷检索目录
英国知识产权局商标数据库信息检索
露天博物馆
博客天下
博客相册
博物馆
博客相册