朱华顺
(东莞理工学院 图书馆,广东东莞,523808)
大数据下的图书馆专利信息服务思考
朱华顺
(东莞理工学院图书馆,广东东莞,523808)
摘要:介绍了大数据的含义、基本特征和对图书馆行业的积极影响以及目前多个行业的大数据运用情况,进一步指出图书馆已经初步具备应用大数据的基础。然后分析了图书馆专利服务现状,指出大数据对于图书馆而言,机遇大于挑战。最后提出图书馆应当积极应用大数据来改进专利信息服务,例如构建一站式专利信息服务平台等。
关键词:大数据;图书馆;专利信息服务;专利信息集成
1大数据与图书馆
大数据作为一种新事物,与历史上很多新技术,在其诞生初期,并没有一个清晰而又明确的定义。综合目前可获取的资料来看,大数据是一种行业理念或发展趋势。维基百科对大数据的定义是“所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息”,这些信息由巨型数据集组成,大小从兆字节(TB)到十兆亿字节(PB)不等。大数据的特征主要有Volume(海量)、Velocity(快速)、Variety(多样)、Value(价值)和Veracity(真实)等[1]。
当前,图书馆运营过程中所产生的数据来源包括RFID 射频数据、传感器数据、社交网络交互数据、移动互联数据等,这些数据已经初步具备大数据的特征,加以分析处理可以有效丰富图书馆的馆藏信息资源。此外,大数据借助计算机技术对数据进行统计、比对、解析得出分析结果,一定程度上提高了数据分析的科学性和准确性。将大数据分析技术应用到图书馆,可以更加精准地分析挖掘用户的行为。
2改进图书馆专利服务的思考
目前国内部分高校图书馆开展的专利信息服务,多从专利说明书、权利要求书等简单内容展开,与用户对于专利高尖端的技术要求有一定的距离。随着信息网络的发展,用户通过网络,特别是一些专业知识产权网站即可获取专利说明书、权利要求书等浅层次的专利信息内容。那么对于用户来说,既然可以通过网络查找到所需内容,似乎没有必要去图书馆寻求专利信息内容,而对于图书馆而言,既然用户需求不大,那么似乎就没必要花费过多的时间和精力去提升专利信息服务。对于双方来说,这都不是一种“双赢”的结果。因为用户由于缺少相应的专业知识,在网上检索得到的很可能只是浅层次的专利信息内容;而对于图书馆,对专利信息服务投入的逐步缺失,最终会导致图书馆慢慢退出这一领域的市场。除了浅层次的专利信息内容,用户对于深层次的专利信息内容,例如专利信息专题培训、专利信息分析与研究、专利预警、专利咨询、专利侵权等服务同样有着巨大的需求。图书馆可以发挥如下两方面优势,满足用户对于专利信息的深层次内容。
1)数字资源优势。除了免费专利检索数据库,包括中国专利局专利检索、世界知识产权数据库、美国专利数据库、欧洲专利数据库、加拿大专利数据库以及日本、韩国、澳大利亚、印度、港台新加坡的专利数据库等国内外专利数据库;图书馆还有Delphion、Aureka、万方专利数据库等付费专业数据库。相比较用户在网络上盲目地查找专利信息内容,图书馆可以发挥专业优势,组织馆员利用大数据分析技术对上述专利数据库进行整合,为用户提供深层次的专利信息服务。
2)人力资源优势。目前国内的图书馆馆员学科构成呈现多学科背景趋势,除了图书情报专业,计算机、经济学、法学、工学、理学等其他多种学科背景的专业人员都进入图书馆。多学科融合更容易迸发出思想火花,与知识产权法跨学科融合的学科属性本身相契合。整合不同学科背景的馆员从事深层次专利信息服务,可以充分发挥图书馆多学科背景的人力资源优势。
3大数据的行业应用
实际上,以亚马逊(Amazon.com)、eBay为代表的大型跨国网络公司,已经开始运用大数据来进行网站设计和产品销售运营。这些公司长期跟踪影响网站性能的因素,包括界面布局、界面内容及其排列顺序、上下级类目连贯性等,对用户的浏览记录进行统计分析以改善网站界面表现[2]。谷歌[3]对其收录的图书进行扫描,对书本中出现的词汇进行词频统计分析,以分析结果为基础,证实了古罗马与中国经贸往来的交通运输路线。美国金融投资机构Capital One[4],收集用户持信用卡消费的详细数据,对其进行整理分析,并以此为基础为用户量身定制个人金融理财产品。据Capital One创立者之一Nigel Morris介绍,Capital One的财务部、计算机分析部和市场部每年要开展65 000次实验来测验新产品对市场的适应程度。
不仅仅是网络公司,许多实体销售商也开始使用大数据。英国零售商巨头Tesco[5]长期收集整理用户的消费数据,使得该公司长期占据英国零售业务的榜首位置。该公司开展了一个会员计划,收集参与该计划的近一千万会员的交易记录,分析会员的消费行为,并以此为依据推出针对特定消费群体的促销活动,收到了良好的效果。具体做法上,该公司保存并分析了会员的消费票据,找出关联度较高的商品,并将这些商品放在相同或者相邻的柜架上,方便用户购买。美国汽车生产商福特公司[6],通过分析客户在社交网站Facebook和Twitter的内容来评估用户对其产品的认可度。福特应用词频分析软件收集用户在社交网站上所发表的关于福特汽车的内容,以“优异、良好、中等、一般、不好”等多个级别对评价内容进行分类,最后推断出用户对其产品的认可度。而国内电商淘宝网[7]也引进了大数据技术,通过淘宝指数、流量解析和数据魔方三项技术指标来了解市场趋势变化情况,从而制定竞价策略。
近年来,国内不少图书馆开始运用RFID (Radio Frequency Identification)即无线射频识别技术,亦是大数据应用的一种。RFID标签可以为图书馆的馆藏资源如图书、期刊、光盘等存储一个对应的标识符号,且此符号与其对应的馆藏资源之间是唯一对应关系,图书馆可以通过这个标识符号对馆藏资源进行精准定位和操作管理。
4运用大数据拓展专利信息服务
4.1积极应用新技术
信息技术的发展对图书馆的影响由来已久,并且新技术总是可以为图书馆带来服务手段的革新。从Web2.0到云计算再到大数据,图书馆总是可以紧跟上技术发展的脚步。对于图书馆来说,新技术固然会冲击图书馆部分的业务功能,但是伴随着挑战的也是机遇,利用好大数据技术,可以提升图书馆的服务质量,增强图书馆的竞争力。
4.2强化学科馆员培训宣传
古语云“内圣而外王”,对于图书馆工作,首先应该明确的是用户对于专利信息内容的需求是多方位和多维度的,其中既包括浅层次需求也包含深层次需求。专利技术,作为推动工业技术发展的重要知识产权内容,具有高尖端的特征。图书馆应当整理现有人力资源,强化对该领域学科馆员的培训,使之满足用户的信息需求。在此基础上,增强宣传推广,积极走出去联系相关企业和个人,宣传介绍图书馆的专利信息服务内容,使图书馆的专利信息服务和市场需求较好地融合。
4.3整合资源,增强合作
图书馆可以从如下三方面进行专利信息资源整合:(1)图书馆现有资源,(2)与企业合作共建资源,(3)新建特色资源。部分综合型专利代理机构面向市场开发了不少专利服务项目[8],这些项目既包括面向特定企业开展专利情报咨询、专利专题咨询等,又有企业自行研发的专利分析工具和平台等。图书馆可以以自己现有的专利信息资源为基础和企业开展合作,以用户需求为导向,开发出特色资源。我校图书馆根据东莞市镇街考核和评估实际需求,组织开发了面向地方科技管理的专利信息统计分析软件PSAS[9],用于定期下发专利原始数据的整理清洗和统计分析,并为地方科技管理部门提供专利情报服务。
4.4搭建一站式服务平台
一站式专利信息集成服务平台是智能搜索的发展趋势,未来的专利信息服务检索平台也是如此。根据校图书馆组织实施的面向地方科技管理的专利信息服务实践经验,认为专利信息集成服务平台可以从如下框架来构建。
图1 一站式专利信息集成服务平台功能框架图
其中,“馆藏专利信息资源”功能模块包含图书馆有专利文献信息导航、图书馆专利图书与期刊等研究资料、专利数据库三个方面的资源。专利数据库既包括图书馆现有数据库资源,也包含与企业合作共建的数据库资源。“专利服务宣传推广”主要指的是图书馆面向用户开展的宣传推广活动,包括用户培训、参考咨询服务,专利新闻聚合等。“个性化服务”主要指用户深层次的专利信息需求,包括科技查新、专利法律咨询、专利信息统计分析、专利预警等。
在使用专利信息集成服务平台的过程中,用户的信息需求处于不断变化之中,可以依次访问各个功能模块,自由进出服务平台(如图2所示)。采用B/S,即浏览器/服务器(Browser/Server)体系(如图3所示)构架建设服务平台。B/S可以较为简单地融入因特网,用户只要可以链接到因特网即可访问到服务平台。采用PHP+MYSQL或者JAVA+MYSQL数据库方式运行并生成相应的指令码语言。
图2 客户端系统构架
图3 基于因特网的B/S应用模型
4.5面向用户推送个性化服务
美国 Hiptype 公司收集用户上网借阅电子图书的记录,分析读者的阅读兴趣和爱好,并以此为基础向用户推送相关电子图书[10]。目前国外主流专利数据库都有专利信息分析工具和软件[11](如表1所示)。如前文所述,经过多年的发展,现在图书馆也已经初步具备应用大数据技术的数据基础。当前图书馆所拥有的读者借阅记录、数据库点击下载记录、图书馆社交网络平台交互数据、用户移动互联数据等,都是可以应用大数据相关分析技术进行分析统计的数据来源。选取其中与专利信息相关的内容,应用大数据技术进行分析统计,推出针对特定群体的即时专利信息推送服务,可以增强图书馆在该领域内的竞争力。
表1 国外常用专利信息分析软件
在当前建设法治国家的大背景之下,知识产权的重要性越发凸显,专利作为知识产权的重要内容,其信息服务需求将越来越大。图书馆拥有数字资源和人力资源双重优势,提升服务意识,整合各方资源,强化服务队伍建设,加强宣传推广,提升专利服务的质量和水平,图书馆在未来的专利信息服务市场中必会有一席之地。
参 考 文 献
[1]维基百科[EB/OL].[2015-08-08].http://zh.wikipedia.org/wiki/大数据.
[2]亚马逊[EB/OL].[2015-08-08].http://www.amazon.com/.
[3]谷歌[EB/OL].[2015-08-08].http://www.google.com/.
[4]美国第一资本[EB/OL].[2015-08-08].https://www.capitalone.com/.
[5]特易购[EB/OL].[2015-08-08].http://www.tesco.com/.
[6]福特[EB/OL].[2015-08-08].http://www.ford.com/.
[7]淘宝[EB/OL].[2015-08-08].http://www.taobao.com/.
[8]杨小凤.国内专利信息服务体系建设现状分析[J].图书馆工作与研究,2013(3):8.
[9]王根.基于地方知识产权战略的专利情报分析软件研究:以东莞市为例[J].情报科学,2011(9):1438-1439.
[10]王玲,李文兰.市场竞争环境下高校图书馆专利情报服务研究:以天津大学图书馆为例[J].图书馆工作与研究,2013(1):67-69.
[11]尹爽.面向政府专利分析服务需求的专利分析方法体系构建[D].长春:吉林大学,2012:55.
Reflection on Library Patent Information Service Under Big Data
ZHU Huashun
(Library of Dongguan University of Technology, Dongguan 523808, China)
AbstractThe paper introduces the concept, characteristic and impact-on-library of big data, and its use in the current industries, proposing that library has big data foundation, and analyzing the current situation of patent information service at library. As for library, big data is an opportunity other than challenge; library should apply big data to improve its patent information service. Furthermore, the paper suggests some solutions, for example, building one-stop patent information service platform.
Key wordsbig data; library; patent information service; patent information integration
文章编号:1009-0312(2016)01-0010-05
中图分类号:G306
文献标识码:A
作者简介:朱华顺(1984—),男,福建漳州人,馆员,硕士,主要从事数字化信息资源管理。
基金项目:2013年东莞市促进科技服务业发展计划项目“面向地方科技管理的专利信息服务创新及提升研究”(2013505140);2014年广东省图书馆科研课题“协同创新环境下地方专利信息服务机制研究”( GDTK1414)。
收稿日期:2015-9-10