□天津科技大学 孙波 陈大辉
浅议用户资源数据库建设
□天津科技大学 孙波 陈大辉
信息是一种重要资源。对于信息服务部门而言,如果没有这种资源的供给,它们就失去了存在的基础。但是,用户对于信息服务部门而言更为重要,如果没有用户需求,其存在的意义也就荡然无存。为此,本文就用户资源数据库建设的目的、意义与方法等展开了讨论。
用户研究;资源共享;数据库
图书信息界向来重视文献资源建设问题,文献资源建设的最终目的是为了满足用户的需求。所以,对于图书信息界来说,用户的信息需求才是其最根本的资源。没有了用户的需求,图书信息部门也就失去了存在的基础。因此,笔者将就用户资源数据库建设问题展开讨论,以求教于同行。
从经济学角度看,信息服务部门与社会之间同样存在着等价交换的关系,也就是说,谁也不能无偿占有对方的劳动。一方面,社会需要信息部门提供的服务;另一方面,信息部门也需要社会的相应支持。对用户而言,信息及其服务是一种可供享用的资源;而对信息部门而言,社会的相应支持则是其赖以生存和发展的必备条件。社会的支持取决于用户对信息和服务的应用,从本质上看,用户就成为信息服务部门不可或缺的资源。如果没有这种资源的供给,信息服务业无法生存。因此,确立“用户资源”的概念,加强用户资源的开发就理应成为关系到信息服务业兴衰成败的重要课题。
迄今为止,各行各业已建立起适用于不同需求的数据库,这无疑对加强信息资源建设、方便用户使用起到了巨大的促进作用。但是,也应当看到,广义的信息系统包括信息源、信息通道和信息用户三者,因为它们是信息系统的基础部分,但在这些基础已初具规模的今天,我们应当将目光更多地转向信息用户,因为只有用户才是信息系统存在的根本原因。
当然,过去我们也曾开展过许多关于用户问题的研究,但多是些定性的或静态的研究,缺乏对现代信息技术的充分利用。在世界走向信息社会的今天,信息服务业逐步电子化,我们应当而且能够建立起动态的用户问题研究信息系统,而用户资源数据库系统就是这样的一种设施。
所谓用户资源数据库,就是在建立信息数据库时另设一空库区,随着用户对信息库的利用而将有关信息自动记入并逐步积累。文献借阅系统也可设立类似的库,信息数据库联网的同时也将用户数据库联网。这样,我们在建立信息服务系统的同时,又设立了用户信息系统,这是用户资源建设最基础的部分。
用户资源数据库的基本内容是建立动态的用户档案,如用户的名称、所属的职业或行业,个体用户的职务、职称、年龄、性别,各种用户对信息的利用情况以及用户建议区等。其中,用户建议区既可以预设若干选项让用户选择,以便于统计,也可以让用户直接填写建议,以便及时发现用户需求的新动向。另外,该库的统计功能应当足够强大,随时可将累积的或某一时段、某一范围的统计结果调出,并应设立相应的用户索引,以便分门别类地或综合地对有关情况进行统计。
所谓用户资源状况是指各种用户对信息的利用状况,通过设立有关的统计指标来反映和揭示用户系统与信息系统之间的匹配状况和相互作用的规律,以便为双方改进系统,并进一步开发信息资源和用户资源提供依据,创造有利条件。
这里的用户资源状况统计分析方法是受文献计量学中有关引文分析的启发而提出的。通过对引证情况的统计分析,可以在一定程度上了解文献被利用的状况,但它只反映了那些著有文献的用户利用文献的状况,并没有反映全体用户利用文献的状况。而用户资源数据库网络则能及时通过“全体”用户利用信息的情况。当然,目前有些数据库已经通过下载量或浏览量的统计实现了这方面的部分功能,但由于缺失用户身份方面的资料,严格说来,还不能算作用户资源统计数据。为此,我们需要将文献计量学中的引文分析方法加以适当改造,才可得到用户资源状况的统计分析体系。
以某信息被利用的次数为纵坐标,以被利用的年度为横坐标,在直角坐标系内做图,便可得到信息利用的时间分布曲线。如图1所示,使用初期,由于用户对该信息及其价值尚不了解,利用次数较低,随着时间的推移该信息及其价值日益为用户所知,利用次数逐年上升,达到某一峰值M后,随着其内容的老化,利用次数随即逐年下降,这是比较典型的例子。用户利用信息的状况很复杂,还会有许多不同形状的曲线,这些曲线既反映了用户利用信息的时间分布特征,又从一个侧面揭示了信息的老化过程。我们可以用峰值一半利用次数的最长年限作为衡量该信息老化的指标,即图中的A点。这有些类似于文献计量学文献老化的半衰期,但“半衰期”通常不是针对个别文献,而是对某一学科或专业领域的文献集合而言的。这里的老化指标则是出自对某一特定信息的利用,因此,可以进行个别分析,也可以进行各种组合的综合分析,甚至可以在某些不同学科或专业的信息利用中找到共同点。
图1 信息利用时间分布
信息的利用随自身类别的不同和用户的不同,在数量上呈现变化状态,如在给定信息分类标准和用户种类的情况下,我们发现不同信息被利用的数量存在很大差别。按照利用数量从大到小的顺序排列,将得到一个递减的数列,即不同种类信息在某一特定用户群中的分布状态。同理,在给定用户分类标准和信息种类的情况下,我们也可以得到某类信息在不同用户群中的分布状态。
通过对信息利用的空间分布的分析,我们还可以将用户或信息进行聚类。例如,不同种类用户利用同一种类信息时,我们称这些种类的用户有耦合关系。耦合强度取决于他们共同利用的信息种类数,共同利用一种信息的耦合度为1,余类推。根据耦合度的大小,我们可以清楚地掌握不同用户群之间利用信息的亲疏关系,从而为合理地设计信息系统提供科学可靠的依据。又如,就某一特定用户而言,其所利用的信息也并非单一种类,随着社会的发展,某一职业或某一行业的用户对不同种类信息的利用会不断产生新的组合关系,通过对这种组合关系的动态跟踪,可以从信息利用的角度来测定不同学科知识间的关系,发现新的科学生长点甚至社会发展态势。同时,还可以对社会所需各种人才的知识结构进行定量分析,从而为信息系统乃至各种专业教育结构的改进提供数据参考。
通过不同用户信息吸收数量的分析和比较,可以十分客观、清晰地对不同的个人、机构、地区以及国家的信息吸收与输出能力做出评价,这也是用户资源数据库建设的一项很重要的基础工作。
总之,用户资源的时间分布和空间分布,从时间与空间两个方面揭示了用户流的规律性,这既可以使信息系统与现有用户确立更好的匹配关系,又可以依据事物的固有规律来培育和开发新的用户群体,可见,用户资源数据库建设的意义重大。
发达国家的信息产业是伴随经济的增长以及用户需求逐步发展起来的,它始终以用户需求为主要动力源。目前,我国国民的信息意识较之发达国家尚缺乏强烈的信息需求,如果我们只是被动地去适应用户的需求,那么不仅信息业发展缓慢,而且会给整个社会的高速发展带来不利影响。加强用户资源数据库建设及管理就是基于这样的认识考虑的,它将被动地适应变为主动地建设,打破了常规的思维定势,超越了传统的发展阶段,从本质上看,更符合我国的国情、民情,因而,无疑会使信息服务业发挥出更大的作用。
市场经济的一个显著功能就是优化社会资源的配置,也就是说,谁占有用户、占有市场,人、财、物等资源就向哪里流动。信息服务部门开展用户资源数据库建设和管理,符合市场经济规律,在给用户带来实实在在的利益的同时,有力地促进了社会的进步,另一方面,也给自身创造了良性循环的内外环境,从根本上改善了信息系统的工作状态。
用户资源数据库是依附于信息数据库设立的,成本低廉,但其创造的社会、经济效益巨大。由于其数据的收集由计算机系统自动进行,所以,可最大限度地降低各种人为因素的影响,使得统计结果真实可靠,较之其它分析方法具有明显的优势。
从某种意义上看,用户资源状况的统计分析是对文献计量学方法的拓展与延伸,同时,它又将计算机及网络技术引入到用户研究中,这不仅有利于图书馆学、情报学研究的深入,而且为社会学、经济学、教育学和心理学等的研究提供新的背景资料和手段。随着科学技术的不断发展,不同学科间的相互渗透、相互借鉴的趋势将更加明显,用户资源数据库建设与管理就是对这一发展趋势的自觉反应,它无疑将更有利于学科结构以及整个社会的知识和信息结构的改善。
乌家培教授曾指出,信息服务业是一个中间产业,它一方面连接信息设备,另一方面又连接信息用户,要抓中间带两头。信息服务业既扩大了信息设备制造业的需求,也增加了信息用户的供给,是两者联系的桥梁和纽带。但是,只有供给而无旺盛的用户需求,信息服务业也难以发展。中国的国情决定了信息服务业不但要满足需求,更要创造需求,而用户资源数据库建设则是创造这种需求的最有利的措施之一,它将极大地改善信息服务业的竞争状态,为使其逐步进入主导产业的行列创造条件。由此可见,用户资源数据库建设的意义重大,应当引起我们的足够重视。
[1]陈大辉.知识产业在新经济增长价值链中的地位与作用[J].中国图书馆学报,2003(4):30-34.
[2]郭强,刘俊友.信息计量学导论[M].合肥:合肥工业大学出版社,2007.
[3]邱均平.市场经济信息学[M].武汉:武汉大学出版社,2002.
[4]张靖.基于P2P的图书馆用户信息资源共享研究[J].硅谷,2010(20):107.
[5]乌家培.信息化浪潮中的信息服务问题[J].情报资料工作,1994(6):3-6.
G25