【摘 要】传统出版单位的数字化转型升级与融合发展是我国“十三五”期间数字出版行业发展的核心动力。在实现这一跨越性发展的过程中,传统出版单位,特别是拥有细分行业领域专业数字内容资源的出版单位,如何利用数字内容资源优势,实现从数字化内容服务到知识服务的转型发展,是最重要的破局点。
【关 键 词】知识产权;数字出版;知识服务模式;创新
【作者单位】刘化冰,知识产权出版社有限责任公司。
一、数字出版转型升级中的知识服务
近十余年来,我国数字出版行业从起步到不断发展壮大,在经历一个高速发展的阶段。2015年,我国数字出版行业营业总收入超过4400亿元,成为新闻出版业重要的经济增长点和主体产业。2016年《新闻出版业数字出版“十三五”时期发展规划》发布以来,我国数字出版行业正朝着年均保持17%以上增速的发展目标不断前进[1]。数字出版行业版图主要由互联网期刊、电子图书、数字报纸、博客、在线音乐、网络动漫、移动出版、网络游戏、在线教育和互联网广告等构成。但在这当中,以传统出版单位为主力的互联网期刊、电子图书、数字报纸等产业的规模,目前在整个数字出版行业中所占比重却低得惊人[2]。
传统出版单位的数字化转型升级与融合发展仍具有巨大的发展空间,是我国“十三五”期间数字出版行业发展的核心动力。而在实现这一跨越性发展的过程中,传统出版单位,特别是拥有细分行业领域专业数字内容资源的出版单位,如何利用数字内容资源优势,实现从数字化内容服务到知识服务的转型发展,是最重要的破局点。
目前,我国许多大中型出版社已经实现专业领域的内容资源数字化、体系化和标准化建设,并依托具有独特优势的专业领域数字内容资源,开展了以数字内容的组织、序化、检索和传递为主要形式,满足用户特定信息获取需求的信息服务工作。实现知识服务模式的转型,还需要在经过加工组织的数据资源基础上,实现不同信息源之间的关联、整合和资源集聚,并进一步对内容资源进行分析、重组、集成,使之成为具有价值的知识。同时,针对用户特定知识需求问题,经过信息分析、重组、创新、集成,形成知识需求问题的综合解决方案。
在以上的知识服务模式中,对数字内容资源的利用,已经不局限于数据本身,而是要基于特定的问题需求,在更多形式类型的数字内容资源中通过深度关联、组织和挖掘,产生更多的二次元、三次元甚至更高次元的知识资源来满足社会需求。简单来说,以往的信息服务模式是一种“钻取式”的服务,即用户从海量的信息库当中通过检索、筛选和分析,抽丝剥茧地挖掘出自己需要的知识。而知识服务则是通过各种技术处理产生更多具有价值的知识资源,以推送的方式,将知识直接呈现在用户面前,用户可以根据自身需要从中进行抽取選择。形象地说,知识服务是一种“抽取式”服务。
二、互联网时代,数字出版行业发展知识服务所面临的新挑战和机遇
互联网时代促使大数据资源产生、共享、集聚和关联,使得数字化内容资源以不同产品形式、服务形态和运营模式快速发展。对于数字出版行业而言,这既是一个最好的时代,也是一个最严峻的时代。发展知识服务模式,并不是一种全新的理念,而是在互联网时代下,数字出版行业发展的必然选择之一。新形势下,数字出版行业发展知识服务模式挑战和机遇并存。
第一,互联网技术的发展。Web2.0模式的蓬勃发展,使得以用户信息产生和共享为核心的互联网信息内容急速膨胀。通过移动端、PC端和无线端,各类数字化内容不断抢夺信息入口。如今,通过人们的眼球、耳膜乃至触觉所接收的各种信息呈几何级数增长。这让我们在更加便捷地获取知识的同时,也必须忍受超载的信息负荷。在这个信息膨胀的时代,用户主动获取信息的积极性正在急剧下降,传统数据库内容加搜索引擎的服务模式已经不是用户的第一选择。更多用户更愿意接收通过用户画像、智能挖掘、点评排名等方式推送的精准知识,同时他们也希望推送过程能够实现无效信息和垃圾信息的过滤。
第二,知识付费服务模式逐步实现。首先,由于用户通过互联网所能够接收到的信息内容越来越丰富,因此他们更希望接收一些高质量和提供优质用户体验的信息内容。其次,由于互联网支付手段的完善与发展,用户对高质量信息资源的消费和付费习惯已经逐步养成。再次,C端用户在互联网信息消费方面已经具有较大规模。这些使得以往数字出版行业中不太可能实现的一些知识付费服务模式逐步具备可以实现商业化的土壤,但其中关键的依然是产品内容质量和服务品质的提升。
第三,数字出版行业的发展。这一定程度上使得传统出版行业结束了相对单一的产品形态发展模式,转而形成产品与服务多元化的服务体系。基于互联网产生的数字出版产品与服务,品种众多、内容多元、服务模式各异。可以说,数字出版的发展,一方面使得用户信息消费的选择更多,另一方面也催生了数字出版行业的细分市场。数字出版行业的市场细分主要体现在两个方面。
一是基于专业内容领域的细分,新闻出版领域的特点之一就是广泛传播人类社会的各种知识信息,因此内容资源涉及的相关行业领域众多。随着数字出版的发展和直达用户的信息传播服务的出现,用户对精准投放信息和专业内容资源产生了迫切需求,更多用户希望通过专业内容资源平台,得到不同专业领域中关于知识内容资源的专业化、特色化服务。二是基于产品服务形态的用户细分。当下互联网期刊、电子图书、数字报纸等产品主力消费人群逐步形成,不同类型的数字产品和服务不太可能像传统图书一样适合广泛的用户群体,而是转向了特定消费人群和消费渠道。因此,数字出版产品与服务的发展,应当更多聚焦到解决特定用户需求、服务特定用户群体上。
三、知识产权领域知识服务的现状与思考
多年来笔者有幸参与知识产权专业领域数字出版的一些工作,并在工作中见证了这一领域的不断发展。与其他领域不同,知识产权专业领域的数字出版发展较早,在20世纪90年代就开展了专利内容资源的数字化建设。2000年,中国知识产权网最先开通了中外专利信息检索服务,实现了对国内外专利信息的一站式检索,这也是国内探索知识产权数字内容资源信息服务的开端。
传统意义上的知识产权内容资源包括专利、商标、著作权、植物新品种、集成电路布图设计专有权、标准及科技成果等数据信息。具体情况如下。
第一,专利数据资源。全球专利申请量已达到亿级以上,涵盖了科技信息、法律信息和经济信息,专利从申请到公开、授权、复审、无效、运营等环节都会产生大量数据。
第二,著作权数据资源。论文、图书、书画、音像作品等创作内容皆为著作权数据信息,囊括了不同领域、不同类型的数据。
第三,其他知识产权数据。除了上述专利数据和著作权数据,工业领域有作为产品标识的商标数据,农业领域有培育植物新品种权数据,半导体领域有集成电路布图设计专有权数据,计算机领域有软件著作权数据,此外,还有企业商业情报数据及科技成果数据等。
以上知识产权数据信息蕴含了丰富的科技信息、法律信息和经济信息,具有重要的科技价值、法律价值和经济价值。
如何开展知识产权领域专业内容资源的知识服务,笔者认为主要的方式有两种。一是data from data(数据生数据)。知识产权(特别是专利)自身就具有知识内容属性并得到了应用,在这些内容资源的基础上,可以不断加工、挖掘以产生具有应用价值的知识资源。二是data to data(数据联数据)。知识产权内容资源不仅具有丰富的内涵,也具备与其他数据相关联的纽带,通过知识产权数据与其他各种数据资源互联互通,最终整合产生的数据将具有新的知识价值。from data to data,即只有发掘数据更多的用途,使其产生更多的价值,知识服务才可能找到更多应用场景,才可以做更多的事情。
从未来发展来看,知识产权专业内容资源的知识服务,主要可以拓展的应用场景有以下几个。第一是政务管理。知识产权内容资源对于政府决策和事务管理的价值不仅体现在各种分析研究报告中,趋势预测、动态监控、行业管理、绩效评价、政务管理……很多方面都可能应用到知识产权相关的知识服务。第二是技术创新。实现多种知识产权数据内容的互联互通,可以让我们更加全面地描绘出行业、技术领域的技术面貌和发展路线,甚至绘制出完美的知识图谱。第三是科技金融。知识产权的价值展现是知识服务的主要方向之一。在其他领域已经实现通过知识服务发现潜在价值和商机的背景下,在金融领域我们需要结合更多的知识资源和采用先进的算法模型来实现知识产权的价值。第四是社交。关注知识产权的人来自各行各业,其中有科研工作者、发明家、企业家、服务者、政府官员、艺术家、法务工作者、投资人等,这些人群通过知识产权的权利效应产生不同程度的关联,他们是知识产权知识服务的精准用户。
四、知识产权领域知识服务新模式的探索实践
在知识产权领域传统信息服务基础上,笔者所在团队近年来不断探索全新的知识服务模式。通过积累和加工数字内容资源,知识产权出版社有限责任公司目前已形成了国内规模最大、资源种类最多的知识产权大数据资源库,实现了专利、商标、版权等多种知识产权数据内容资源的整合和关联。同时,基于这些数字内容资源,开发建设中国知识产权大数据与智慧服务系统——知了网、专利代理机构导航评价系统、企业知识产权商情服务系统——知企查等产品。下面笔者就这些知识服务产品的部分应用场景和服务模式进行介绍。
1.垂直导航技术应用
在中国知识产权大数据与智慧服务系统中,我们在检索结果中引入了垂直導航技术,用户可以在专利搜索结果的概览界面上,查看左侧的分类项数据导航条。不同的检索系统中,数据导航条设置的项目是不同的。
这些数据导航条的设置,可以让用户快速了解当前专利检索的结果当中各类型数据的分布情况,既可以帮助用户快速了解数据信息,又可以给用户的数据应用提供引导。例如,当用户通过区域代码检索江苏省的全部专利文献的时候,他们可以从不同维度上了解相应专利数据的统计结果,并进一步查阅相关的数据信息。通过这些数据导航条,用户可以了解到江苏省历年专利申请情况,当前有效、无效和在审查专利的分布情况,专利运营转化的情况以及技术合作的情况,等等。
专利导航条则可以帮助用户进一步优化专利检索策略,实现更加符合检索需求的专利检索。例如,用户可以查阅当前检索结果中的IPC分布情况,查看当前检索结果中都有哪些关键词,以及其中主要的专利申请人的情况,等等。
而且,垂直导航技术还可以帮助用户快速定位自己感兴趣的专利数据。这样,用户就不必每次在检索过程中去设计复杂烦琐的检索表达式,只需要事先锁定检索范围,就可以准确查询他们所需要的专利文献信息。这种模式,可以帮助用户快速定位所关注的知识情报。
2.可视化检索应用
通过采用知识图谱的理念和技术,我们可以让用户在可视化的环境中完成专利检索的工作。传统模式下,专利检索的步骤包括确定检索主题、确定专利的分类位置和关键词,构建检索策略、实施初步检索,调整完善检索策略,对检索结果进行修补,完成检索过程五步。在这种模式下,完成一次专业化的专利检索,信息工程师往往需要花费大量时间进行检索表达式的编辑,确定检索分类位置和查找同义词、相关词。并且,在这个过程中,用户往往需要查询和阅读大量文献,才能更好地确定检索所用的关键词和分类号。
而采用如图1的可视化检索方式,可以建立仿人工思维的智能化检索模式。我们直接输入需要检索的原始文本内容,系统就会自动进行关键词的抽取,并进一步联想到这些关键词的相关词、分类位置和申请人等知识,通过对这些知识的组合,就可以让用户快速构建起较为专业的专利检索表达式。
3.构建行业和企业级知识图谱
行业和企业级知识图谱的构建与常规的行业、企业专利分析不尽相同。通过构建知识图谱,可以建立更多维度的数据关联,从而可以从更多的视角洞悉行业和企业的知识产权情况。
以企业为例,图2中展现的是企业知识图谱构建的全过程。首先,企业从互联网和各种数据库中获取与企业相关的各种数据信息,通过算法的抽取和集成,抽取其中的企业实体名称及各种事先定义好的属性信息,再通过人工筛查分类,形成基于RDF三元组的各种企业和属性标准知识库。其次,这些知识库可以进一步与企业相关的各种知识产权信息关联,包括专利、商标、标准和著作权等信息,这样就构成了企业知识产权知识库。采用知识图谱对这些知识库进行深度分析挖掘,就可以形成不同维度(企业本身、行业、区域等)的知识图谱。
通过这些知识图谱,我们可以挖掘分析企业的知识产权创新能力,可以用不同的指标分析企业整体知识产权情况,包括其专利权利状况、总体数量、运营情况、主要研发团队、专利代理情况、技术领域情况,等等,可以进一步关联企业的工商、金融等情报信息,并实现对企业商标、版权和标准等知识产权信息的关联发现。
总之,基于知识产权大数据,知识产权领域知识服务的探索还有很长的路要走,特别是人工智能技术的引入,为我们进一步开展基于专业内容资源基础的深度知识服务提供了想象的空间。
|参考文献|
[1]新闻出版业数字出版“十三五”时期发展规划[Z]. 国家新闻出版广电总局,2016.
[2]2015—2016中国数字出版产业年度报告[Z]. 中国新闻出版研究院,2016.