摘 要 运用数据分析我国高校图书馆机构库建设过程中出现的博弈现象,提出了其持续发展的新理念。于技术上开辟新路径——嵌入数据监护,运用数据监护实施数据存储技术使其由原先的数据仓储转为高质量元数据转换平台;在服务经营中于知识层面上拓宽新维度,论证了高校图书馆机构库的高效运行模式是学术共享空间。只有嵌入数据监护和学术共享空间互赢的机构库才能最终实现数字资源的再利用、学术价值的再体现、社会价值的再创造。
关键词 高校图书馆 机构库 数据监护 学术共享空间 高效运行
分类号 G250
Abstract Using the data analysis of the university library building institutional repositories phenomenon occurred during the game, presented its new concept of sustainable development. Open up new paths in technology - embedded data monitoring, the use of data monitoring implementation of data storage technology to make it from the original data warehouse converted into a high-quality metadata platform; operations in the service level of knowledge expand new dimension, demonstrated the university library institutional Repository efficient operation mode is the academic shared space. Only embedded data monitoring and academic institutions share space mutual win library in order to ultimately achieve the re-use of digital resources, academic value and then reflect, re-creation of social value.
Keywords University Library. Institutional Repository. DataCure. Academic Commons. Efficient operation.
机构库(Institutional Repository,IR)发展十余载,从当初用户的众口铄词:数据库、抽屉、门户、界面、服务、商品广告、在线论坛及维基百科、像知识产权的广告、管理者的金矿等[1],到专家学者的定义:Clifford A.Lynch从大学图书馆的角度,认为机构库是大学为其员工提供的一套用于管理和传播大学各个部门及其成员创作的数字化服务产品;而SPARC事业部主任Richard K.Johoson则认为机构库是一个数字化资源集合,捕获并保存单个或多个团体中的智力产品[2]。因此,可以认为机构库是一个学术机构团体,通过网络使其成果成为数字资源并促使全球共享,实现其开放存取的社会价值。
1 我国高校机构库建设现象分析
1.1 与国外机构库的差距
国外著名网站DOAR数据显示,截止2011年5月,全球开放存取机构库数量排前四的分别为:美国398个,英国193个,德国146个,日本146个,其总和约为世界总量的44.6%。而我国大陆在DOAR中出现的仅为10个[3],其中高校有7家,分别是清华大学、厦门大学、浙江大学、上海交通大学、中国科学技术大学嵌入式实验室、电子科技大学中山学院和大连理工大学。从信息资源使用的语言界面来看,厦门大学和上海交通大学是中文,大连理工大学是中、英、日三个文种,其他都是英文,界面语言缺乏本土化和全球化的统一;从信息资源数量上看,厦门大学12 041条,大连理工大学3 421条,中国科学技术嵌入式实验室1 623条,清华大学953条,上海交通大学90条,浙江大学11条,缺少一定量的信息资源支撑,与学术和社会影响力大相庭径;从使用权限看,大都设有权限,有的需登记注册(中国科学技术大学嵌入式实验室),有的只针对本校师生员工(电子科技大学中山学院),并没有实现真正的开放存取[4]。
2010年1月10日,西班牙的赛博计量学实验室(Cybermetrics Lab)按照规模(size)、显示度(visibility)、内容丰富性(richfiles)和学术性(scholar)4个标准为条件的开放存取机构库400强中,中国大陆榜上有名的唯有厦门大学,排在第241位,2011年7月下滑至第252[5]。现今我国大陆高校中“211工程”“985”大学超过百所,但其中建有机构库的比例却不到10%。由此可见我国大陆高校机构库的建设无论从数量上还是内容质量上与世界发达国家相比都有很大的差距。
1.2 高校机构库建设中存在的弊端
多种资料显示,我国高校机构库从早期的热情倡导到现今的徘徊不振,主要是建设过程中存有弊端。
(1)理想与现实博弈:理想层面的表象认识,现实层面的残酷碰壁。知识信息源共享是当初机构库建设的理想,现实中由于知识产权的纠纷和固步自封的思想意识至使缺乏完整的开放存取概念,只知“取”,不知“存”——简单的索取资料形式;出版机构、机构建设者和用户三者间没有形成良好的协作利益关系,导致机构库资源产量少、质量低。
(2)“学者认知度”和“文献贡献量”的博弈:IR资源周期性建设缺乏长期规划。没有相应的IR建设政策和法规,难以提高学者对机构库的认知,缺乏足够的经费和技术力量吸引“存”和“存者”;无法利用“取”和“取者”来宣传、提高学者的学术价值和信誉度,使学者的文献供应由个人理性形成的集体非理性决定,导致机构难以形成良性循环,运行不稳定,服务功能欠缺长期保藏和维护,机构资源陷入困境。endprint
(3)资产投入与价值产出的博弈:高效的投入低效的产出。如我馆高校机构库的建立在前期投入大量的人力、物力和财力,但得到的回报却无法用实际效益来计算衡量,IR最终只是个“文件存档”,鲜有成果创建。投入和产出比例失衡难以彰显IR的社会价值,导致我国高校IR建设热情锐减。
(4)运行机制的控制与用户平等的博弈:垄断资源使开放共享成为一厢情愿。IR是收集、保存大学单个或集体信息资源的知识机构,有着对学术资源的产生、重现、创新的控制权,但是在使用过程中用户之间的信用度以及对资源的拥有权、垄断性则会与IR出现不平衡,IR的控制力和用户间的平等共享权的博弈难以保证IR内容的完整全面和信息资源的产生、利用的流畅,这同时也是导致机构库的内容可用性欠佳的原因之一。
因此,IR的建设应加大建设力度,高效运行,在技术层面上进行数据监护,在效用层面上努力营造学术共享空间,以推进我国高校IR的持续发展,实现一个真正的学术信息长期保存和共享交流平台,展示其数字资源和谐发展空间,以实现资源的社会利用价值。
2 数据监护承载高校图书馆机构库建设的高效运行
2.1 数据监护特点
根据2008年美国伊利诺伊大学图书馆情报科学研究院Shreeves和Gragin的定义及英国联合信息系统委员会JISC(Joint Infoumation Systems Committee)的解释,数据监护(DataCure,DC)是指根据数据对学术、科研、教育的价值和效用,对其进行积极持续的管理和完善活动,包括长期的获取和使用过程中的数据评选、重现,持续性补充更新和组织维护等,并能用于未来再发现和再利用。数据监护又称数据存管,英美学者大都认为的数据特指科学数据,有着如下特征[6]:(1)动态的数据管理系统性维护;(2)是各种形式记录的数据,具有学术性、科学性、广泛性的活动;(3)生命周期内持续性的存管,循环利用价值服务。
2.2 高校图书馆机构库理论层面的数据监护
勿庸置疑,高校图书馆在信息资源建设方面,无论是早期的学科库、特色库还是现今的IR,从学科特色上分门别类地收集文献资料到提出数字信息资源的交流共享都有着一个共同的软肋,即缺失数据监护,忽视数据的动态生存状况,只是静态的罗列数据。特别是IR,至今为止,不少学者发现其并没有得到广大用户特别是高校的青睐,萨洛(Salo)认为机构库是学者对其无所谓,图书情报专业对其不教学,甚至图书馆员对其知之甚少,存在模糊的价值定位,缺失的后继服务,消极的用户参与等问题。造成这些问题的因素,一方面高校拥有大量各种教学、科研、行政原生数据,图书馆IR建设时只顾其收集,往往忽略其生存状况;另一方面图书馆IR里面有着本校师生大量的小学科(Small Science)和冷学科(Cold Science),它们因数量多、分布散、规模小、种类杂而长期处于数据管理的雷区和盲点。这些数据有的寥寥几许,有的参与者只是个别,有的数据所属学科尖端,它们及其相关信息既无统一处理标准又无相应分享机制,更无长期保藏利用策略。但这些暗流涌动的“长尾”数据随着时间的推移总有一天会汹涌澎湃。IR作为用户服务项目机构,为了提升自身的服务效果,避免小学科的冲击波和冷学科的学术边缘化,为其提供可靠的、具有生命力的生存渠道,应实行数据监护,建立数据阶段存储库(Data Staging Repository,Data StaR)——全局式监护(Curation Continuum),即针对本校师生的数据监护服务,以其机构库为基础,充当学术界共享数据集时的一个短期的、过渡性仓库——临时数据存储节点。由IR的图书馆员负责操作,建立多种格式的高质量元数据交换平台,协助师生学者完善数据,为他们在学术界各自领域提交、发布、生产数据成果,使其使用、共享和保存,通过数据监护来完善IR的长期开放存取,实现IR的高效运行和学术价值的再利用[7]。
2.3 高校图书馆机构库实践层面的数据监护
嵌入数据监护使高校图书馆机构库持续发展得以峰回路转。由于高校图书馆IR的建设在实际过程中注重收集本校学术资源,提供存储功能只涉及终端成果,数据监护看重的是整个科研全过程的数据直至跟踪利用价值去向,存储节点跨行业多学科;运行过程中IR是静态的仓储库,数据监护是动态的反应堆;IR以藏为主,数据监护以用为主。高校IR的文档信息往往形式机械化、规模集中化、流线单一型,数据生产方式、学者互相合作多是垂直树状,在实际使用过程中一旦出现断裂,链条效应立刻产生无路可走现象。因此在建设IR时可以通过调查来了解师生、学者的心声:在IR使用中是否需要原生信息资源数据还是加工数据;是否需要协作空间,以便共享资源;是否需要了解用户使用资源的方法、途径、目的;是否需要跟踪信息资源被利用的对象和能否产生新价值等等来使得数据监护成为IR持续发展的技术平台。
数字化存储技术的运用使数据阶段存储库更注重网状协同,具有生态化、个性化、弹性化、去中心化的特性,在实践操作中我们应通过与师生、学者的多次交流及反复沟通,将少量多批的、跨学科的、交叉边沿学进行整合、归类、提档,帮助师生、学者完成数据的检索处理、提交利用,建成人性化的IR学术共享空间互动平台。
3 学术共享空间是嵌入数据监护机构库的高效运行模式
3.1 学术共享空间的出现
近年来图书馆界在共享空间(commons)基础上兴起了一种学术共享空间(Academic commons,AC;Sholarly commonc,SC等)新学说,其服务理念和服务模式有着更广泛的意义,强调满足协作式学术需求。学术共享空间侧重于为研究人员(教师、研究生、学科组等研究型群体)的科研学术活动、研究协作过程给予全方位多角度的信息资源、信息技术、研究数据、研究过程管理等方面的全面支持和保障[8]。endprint
美国伊利诺大学图书馆对学术共享空间从三方面进行界定。首先,它是一种咨询空间,通过专家学者提供在现代学术环境中的教学学习和研究新模式的探索支持;其次是一套组合服务项目,通过高级的硬件和软件服务,以解决文本编码与分析、数字化、定量分析、空间分析、文本识别及网络应用等问题;最后,其目的是为虚拟学习环境提供研讨会信息、学习提示、研究工具及最新发表的学术论文等各种资源[9]。
我国学者任怀树借鉴国外研究成果和实践经验,结合国内实际情况,将学术共享空间归纳为学术机构库、学术社区、整合型学术服务环境三种类型[10]。
由此看来作为大学图书馆的IR与之血脉相承。学术价值的重复利用,社会价值的多次体现,既是IR和AC的一个重要区别,也是高校IR持续发展良性循环的一个重要标志。
3.2 学术共享空间对于机构库的示范意义
第一,从服务对象和服务项目来看。IR主要面临的是本校的本科生;AC主要针对的是教师、研究生、科研人员和学者。IR服务项目主要是文档存管,更像实体档案馆;AC侧重数据的存在与交流,可以通过数据监护分析文本的编码、识别文本动态变化,为研究人员提供三维科学依据。
第二,从学习目的和服务方式来看。IR虽然既有实体的学习环境,比如提供具体的学习场所,又有虚拟的空间(各种网上学习交流平台),但却限于简单的介绍,更像做广告;而AC注重的是虚拟学习环境的建设及流程推进,研究人员可以在虚拟的环境里通过互动形式提供各种信息资源,展示各自的研究项目,自愿地上传论文和学术成果,享受图书馆员通过嵌入数据监护的实质性服务。
第三,从服务内容和目的来看。IR主要是提供本科生的学习资料,为他们获取学习资料、学习心得提供方法途径和物质条件;AC推进的是研究人员的学术交流,更注重的是信息资源的原生数据的提供,为他们获取研究成果提供硬软件全套组合服务。IR的愿景很好却事与愿违;AC全程保持着动态的服务,体现了一贯良好的综合前景。
3.3 学术共享空间使高校机构库高效运行成为可能
学术共享空间从服务对象、学术空间、学习环境、资源来源、服务项目、服务形式上为高校图书馆IR提供了实践意义。嵌入数据监护机构库的服务模式便是IR群对其匹配资源的结果,最终IR通过收集、提交、转换、数据监护等来实现高效运行。集散型数据链为匹配中心,即:一个用户(C,consumer)进入IR后,将有DS(Data custodial staff,数据监护人员)去满足其需求,为满足他的服务,IR的数据监管人员可以在上游的各个支游IR市场(marketPlace)寻找数据(data),最后达成对用户的服务(S)形成学术共享空间(AC),从直接面对用户变成通过数据监护(DC)面对用户。这样,IR不再是简单的信息资源服务平台,而成为“提供数据,长期保藏”的数据协同平台。在为用户提供服务的同时积累数据,藏身服务平台之后蓄势以待,继而华丽转身从后台走向幕前,成为学术共享空间的数据交换平台。IR要想持续发展,就要有越来越丰富的信息资源。物理学上说越多的分子相互碰撞获得的“熵”越大,对于IR来说不是单个个体用户的而是IR群的“熵”,实施数据监护的IR系统具有同样的原理,这也是IR追逐学术共享空间的目标所在。
4 结语
一个机构库的建成对于一个高校来说是一项艰巨的工程,最终的成功并不是它的建成而是它的维护和高效运行,脱离了数据监护技术或是撇开以学术共享空间为目的的高校图书馆机构库,就像盲人摸象,无所适从。所以现今高校机构库持续发展则是一场学术共享的高端延伸,最终的开放存取和学术价值再创造是大家的共同愿望。
参考文献:
[ 1 ] 李晓辉.机构库愿景实现过程中面临的若干问题述评[J].图书馆建设,2010(4):2.
[ 2 ] 机构知识库[EB/OL].[2010-12-25].http://baike.baidu.com/view/4970721.htm.
[ 3 ] 冯英华.高校机构库实现机制研究[J].国家图书馆学刊,2012(2):61.
[ 4 ] 舒蓉,韦衣昶,王玲玲.基于开放存取的大陆高校机构库研究[J].图书馆界,2012(1):61-64.
[ 5 ] 世界机构知识库最新排行榜发布[EB/OL].[2013-1-22].http://blog.sciencenet.cn/home.php?mod=space&uid=1557&do=blog&id=471536.
[ 6 ] 刘雄洲,王菲.国外数据存管实施现状及其对国内高校图书馆的启示[J].图书馆,2012(5):81.
[ 7 ] 杨鹤林.从数据监护看美国高校图书馆的机构库建设新思路:来自DataStaR的启示[J].大学图书馆学报,2012(2):23-28.
[ 8 ] 王婉,王萍.从IC到AC:国外大学图书馆学术共享空间的发展与启示[J].图书馆学研究:应用版,2011(8):82.
[ 9 ] 吴敏琦.学术共享空间:美国研究型大学图书馆的新探索[J].情报杂志,2011(10):174-177.
[10] 黄勇.学术共享空间:国外的研究与实践进展及其对中国的启示[J].情报杂志,2012(5):67.
王文联 南京工程学院图书馆馆员。江苏南京,211167。
(收稿日期:2013-07-16 编校:刘 明)endprint