于大伟
对专利信息利用困境的思考及对策探析
——以构建专利数据开放平台为视角
于大伟
互联网时代的到来,不仅使技术创新日新月异,也催生出前所未有的商业模式;不仅颠覆了人们的思维方式,也变革着现实中的组织形态;不仅对传统产业形成冲击,也给政府管理带来启示。通过对当前专利信息利用困境的思考,提出构建专利数据开放平台的理念,以期基于原始专利数据的开放共享,大幅提升专利信息的传播利用效率,为知识产权行业注入生机,促进形成互利共赢、健康发展的知识产权行业生态圈。
专利数据开放平台 专利信息 大数据 知识产权服务业 知识产权行业生态圈
专利信息是集技术、经济、法律信息于一体的综合性信息,是一种基础性、战略性资源,有效利用专利信息是提高国家创新能力的重要手段,也是提升知识产权服务业发展的强力引擎。但目前的专利信息服务局限于搭建以检索功能为主的信息平台、建设行业专题数据库等方式,日益多元化的用户需求无法得到满足,专利信息的价值未能得以深入挖掘,专利信息利用陷入困境。本文旨在提出专利数据开放平台的理念,通过对原始专利数据的开放共享和对用户交互行为的反馈分析,扩大专利信息公共服务和商业服务的外延,提升专利信息的传播利用效率,构建开放生态系统,为行业注入生机活力。
(一)当前专利信息利用困境
1.地方专利信息服务平台遇冷
近年来,随着全社会知识产权意识不断加强,企业、高校、科研机构等对专利信息的需求与日俱增,各省市加大投入建设地方专利信息服务平台,为公众提供以专利检索为主的服务项目。为了解地方专利信息服务平台的使用情况,笔者采用AlexaaAlexa:从1996年起提供全球互联网网站排名、流量、访问量、页面浏览量查询服务,2002年起与Google合作,每天在网上搜集超过1,000GB的信息,是当前拥有URL数量最庞大、排名信息发布最详尽的网站。对部分较知名地市的平台进行浏览量调查,结果不甚乐观,日均IP和PV多出现统计不到的情况bAlexa中的IP是指以IP地址区分的浏览者数量,不会重复计算,PV是指浏览的页面总量。由于对浏览器和安装服务有要求,Alexa并不能够精确地统计访问情况,特别是对日均IP在100以下,排名在十万以外的网站,容易出现统计不到的情形,而排名越高、浏览量越大的网站统计越精确。。作为对比,国家知识产权局网站的日均IP量在9万左右,日均PV量在28万左右,专利查询系统的访问量占到全站的40.15%。
互联网时代,信息的不均衡性被打破,地方政府相对于中央其原所具有的空间优势已被消解。考虑到基础数据的权威性、准确性、完备度,用户无疑会倾向于选择由国家层面直接提供的服务。当前专利信息公共服务体系的国家、区域和地方三级架构体现了政府部门传统的层级化管理思维,却忽略了信息唯一性的特点,专利数据仅在官方机构间单向流动,服务范围并未实质扩大。
2.行业专题数据库服务滞后
在国家自主创新政策引导下,我国行业专题专利数据库的建设步伐加快,已建立武汉光谷、包头稀土、兰州石化、天津环保等多个国家级专题专利数据库。但众多的专题数据库同样存在着使用不足、维护不力的问题。数据显示,使用专题数据库的比重,各地方局仅有三成,中介机构仅一成c黄迎燕、张曦等:《专利信息传播、利用与服务调查研究》,国家知识产权局学术委员会课题 2009年3月。。笔者调查中还发现,有些专题数据库难以通过搜索引擎寻找到入口,包括兰州石化、长春医药在内的多个专题数据库则链接失效,已无法访问。
在创新活动日益活跃的今天,政府层面主导建设的行业专题专利数据库颇感力有未逮。科技进步带来产业融合,新的细分技术领域不断出现,而政府部门固有的工作模式无法对此进行有效支撑。以汽车产业为例,当前谷歌、苹果、三星已瞄准智能汽车发展,阿里收购高德地图意图掌控智能汽车入口,广大汽车制造商也纷纷表示将开放车内系统,拥抱智能手机和移动设备,特斯拉对汽车行业的颠覆更是带来巨大冲击。而我们在为十大重点产业调整规划服务的汽车产业专题数据库中,仍然限于发动机、底盘、车身等传统分类,政府服务的滞后性和对创新活动的跟进乏力已显露无疑。
3.优质专利信息服务产品匮乏
公共服务方面,目前的专利信息公共服务平台大多仅能提供基础的检索功能,导致专利文献数据虽数量庞大,但出口狭窄;虽及时公开,但如同封闭;虽免费提供,但价值有限。同时,公共服务模式仍主要停留在搭建信息平台、建立专题数据库、分析重点领域、提供咨询检索、举办培训讲座等方面,而没有形成面向更广泛创新群体、切实有效的服务支持,无法适应当前不断多元化的专利信息服务需求。
商业服务方面,由于专利信息服务产品的开发成本高、时间长、难度大,国内致力于相关业务的社会机构屈指可数、能力有限,高端专利数据库和检索分析工具始终被国外厂商垄断且价格昂贵,实际可供选择的优质专利信息服务及产品相当匮乏。情报学中的穆斯定律指出:“一个信息检索系统,对用户来说,如果他取得信息比不取得信息更伤脑筋和麻烦的话,这个系统就不会得到利用”,其解释了用户面对专利信息服务现状时的困惑与无奈。
(二)以互联网思维思考如何促进专利信息服务
互联网思维打破了工业时代传统的中心化、层级化、程序化的思维方式,代之以去中心化、扁平化、交互式的用户导向和平台理念。其主张需求驱动产品、用户体验至上,数据驱动运营、免费创造收益,社会化交互协作、创新快速迭代。以此理念反观专利信息服务,我们可以:
1.重新审视用户需求
单纯的原始专利信息已不能满足高效检索、分析预警等工作需求,经过专业化、智能化加工的高质量数据,以及与企业自身研发和经营活动密切相关的商业、科技、法律等多种信息的有机融合才是用户未来的选择趋势。这就要求信息服务者把对用户需求的理解从“用户需要专利信息”转变为“如何利用专利信息为用户创造更高价值”。
2.重新审视政府角色
经济学家科尔内d雅诺什・科尔内(Janos. Kornai, 1928~),世界经济学界大师级人物,在20世纪80年代初对中国等传统社会主义国家如何由计划经济向市场经济转轨提出改革理论,著有《短缺经济学》、《通向自由经济之路》、《社会主义体制——共产主义政治经济学》等重量级著作,多次提名诺贝尔经济学奖。认为,“社会主义政府常常具有父爱主义倾向,往往认为自己比百姓更了解他们的需求,政府的努力比百姓自己的努力更能让他们过上好日子。但许多事实证明,政府投资往往效率低下,对经济发展反而起到消极作用。”政府在公共服务资源配置中起主导作用,面向中微观层面开展专利信息服务,事实上制约了市场资源的有效对接和优势互补。只有把有形的手与无形的手有机结合起来,为社会化交互协作营造空间,才能增强行业创新能力,促进其良性健康发展。
3.重新审视服务体系
当前的服务体系,由政府层面提供专利信息,公众、企业或行业通过有限渠道被动接收,无论政府如何努力,呈现出的始终是政府与用户间单向价值链的传递。由于缺乏反馈机制,政府部门无法获知服务的真实效果,亦无法研判信息利用的整体情况,进而无法及时改善服务方式和内容。只有转变信息利用方式和体系内成员的交互方式,才能为服务体系带来生命力,从根本上摆脱当前困境。
综上,本文认为,将基础专利数据更开放地提供给社会,让创新者自己或社会服务机构按照市场规律发挥专利数据的威力,以此尊重用户需求、转变政府角色、优化服务体系,提高专利信息的传播和利用效率,应当是政府部门予以关注并大力推动的。
(一)专利数据开放平台的概念
在互联网时代,将网站的数据、资源、服务封装成符合一定标准的接口开放出去,供第三方开发者使用,这种行为称为开放API(Application Programming Interface,应用程序接口),提供API的平台本身就称为开放平台。专利数据开放平台是秉承互联网开放、平等、协作、分享的精神,以我国所拥有的结构化的原始专利数据为基础,通过遵循一定技术标准,开放API接口,向公众提供专利基础数据服务的数据平台。专利数据开放平台通过免费或低成本提供开发级别的数据使用权,吸引开发者或服务机构对接口进行调用、开发,从而改进专利信息利用方式,丰富互联网上专利相关应用e笔者在调查 中发现,在 全球最大的 开源项目托 管网站Github 上,与专利 有关项目仅 百个左右, 其中最活跃 的 “patent processor”项目也仅有8个fork(分支,每个分支代表有一个用户将其下载进行二次开发)。作为对比,与谷歌地图(Google Map)相关的开源项目有4931个,其中最活跃的“gmaps”项目有644个分支(2014-3-27)。可见,目前与专利有关的应用数量十分稀少,专利应用开发是片蓝海,大有可为。,改善知识产权服务,传播知识产权文化,同时为开发者和知识产权服务机构营造商业空间,以此打造开放共赢的知识产权生态圈。
(二)构建专利数据开放平台的意义
1.专利数据开放平台是政府和市场发挥各自作用的“黄金分割点”
中央在全面深化改革进程中着重强调要加快转变政府职能,使市场在资源配置中起决定性作用,最大限度减少中央政府对微观事务的管理,进一步简政放权,拓宽主动公开渠道,加大信息公开力度。以此为纲,专利信息服务工作也应更多地放手市场、依靠市场,将政府职能定位于基础建设和环境营造,而把细节化、专业化、本地化服务交给市场。
对政府而言,通过专利数据开放平台为整个行业提供元数据支持,营造良好生态,并从平台获得闭环反馈,从而可以更加及时地了解行业动态,支撑产业发展。对市场而言,专利数据开放平台可以极大降低第三方开发者使用专利数据的门槛,使其得以更高效地响应用户需求、服务科技创新、创造商业价值。
2.专利数据开放平台使专利信息流动加速、价值倍增
一方面,由于传统检索入口的简单固化,以及存在部分非结构化的数据,导致相当规模的专利文献难以检出,文献价值未能充分挖掘。而专利数据开放平台可将非结构化的数据以特定方式开放出去,采用效率大大优于当前深加工体系的众包f众包:指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的大众网络(通常是大型的)的做法,其优势不仅在于经济效率,有时候,用户的作品更加出色。参与者就是最关心产品的人,他们最理解用户需求。在2014年马来西亚航空MH370航班失联事件中,卫星公司Digital Globe就将其众包平台开放,通过全球网友的力量,寻找马航MH370的下落。模式由开发者对其进行加工。随着平台上结构化数据所占比例的提升,专利文献价值被挖掘的几率亦随之增大。另一方面,基于原始专利数据的开放,众多开发者和知识产权服务机构通过专业化手段不断从专利信息中萃取价值,针对不同用户开发出各具特色的优质应用,专利信息渗透至每一条需求缝隙,惠及更广泛创新主体,极大减少重复建设,提高数据资源使用效率。由此,专利信息在开放平台的推动下与服务机构的良性竞争中实现价值倍增。
3. 专利数据开放平台使专利大数据“活”起来,驱动行业发展
在大数据概念袭来之时,人们不免会想到从海量专利数据这座宝藏中发现价值。但本文认为,目前的专利数据还算不上大数据,只能称其为大规模数据。在大数据的4V特点g维克托・迈尔-舍恩博格和肯尼思・库克耶在《大数据时代》(浙江人民出版社 2013年1月版)一书中阐明了大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。中,“Value(价值)”的重要性应在其余三者之上,大数据的意义正是在于体现价值和远见。目前的专利数据尽管规模很大,但实质上仍是一条条固化的数据,简单重复,虽然通过统计分析能够发现一些行业动态,但对于专利大数据来说,其更高价值应体现在与创新主体的互动中。数据使用者抓取数据的内容、频次、维度是怎样的,不同类型使用者对数据的偏好、分析策略是如何的等,类似这样的“互动数据”才能真正构成专利大数据,对这些“互动数据”进行分析能够帮助我们更准确地进行技术对比、动向监测、竞争力研究等,进而做好专利预警、专利分析、产业导航以及政府决策。
专利大数据要落地,专利数据开放平台是其最佳载体。在开放平台的工作模式下,平台数据的每一次授权、调用都会留下记录,平台可以获取到所有的交互信息。如此,开放平台使得沉寂的专利大数据真正“活”起来,这将为政府部门把握形势、完善政策,为服务机构探索新的商业模式等留下广阔的想象空间。
(三)国外主要知识产权局专利信息服务及专利数据开放情况
1. 美国专利商标局(USSPPTTOO)
美国总统奥巴马上任伊始便签署《透明和开放政府备忘录》,推动建立更加透明、易于参与的协作型政府。目前,各联邦政府机构通过Data.gov等平台开放大量政府数据和资料供公众和第三方机构使用。USPTO自2010年6月起与Google、并进一步从2013年6月起与LexisNexis 旗下的Reed Tech公司合作,为公众免费提供愈加便捷优质的专利数据下载服务。从USPTO网站提供的一份名为“2014 USPTO Product Matrix”的清单可以看到,该数据集包含了1790年以来授权专利图像数据、1976年以来授权专利全文文本数据、1870年以来商标注册图像数据等16项,囊括各种格式的电子数据资源,总数据量达30TBh1TB=1024GB.以上,并持续更新。
2. 欧洲专利局(EPO)EPO
目前,EPO已建立了自己的数据公开平台data.epo.org,该平台将发展成为获取欧洲专利原始数据的重要渠道。EPO也是目前五大局中唯一开放API的专利局,其通过OPS(Open Patent Services)为用户提供稳定、高质量、多类别的专利数据。根据其介绍和笔者测试,该服务有如下限制:(1)非付费用户每周可使用数据量的上限为2.5GB,付费用户没有限制;(2)中国大陆用户无法正常连接到OPS的开发者入口。OPS遵循RESTfuli架构进行建设,高效稳定,开发文档全面详实,可以作为建设专利数据开放平台的最佳参考。
3. 日本特许厅(JPO)JPO
为鼓励私营企业进入知识产权信息服务市场、在市场竞争中创造高附加值的服务,JPO以边际成本定价,提供批量标准化的数据。该数据源自JPO内部数据库系统,由JPO和INPIT(日本工业产权信息和培训中心)提取后删除重复部分以保证数据一致性,并将数据转换成XML/ SGML的标准格式。同时,JPO正按边际成本定价政策,积极筹备将批量数据通过因特网免费提供给用户j[日]赤穗州一郎:《日本专利局面向公众的专利信息服务与海外合作》,2013中国专利信息年会 2013年9月13日。。日本的在线专利信息服务仍然是以IPDL(工业产权数字图书馆)为主,提供发明、实用新型和外观设计专利公报数据库及检索,商标数据库及检索等服务,但并未开放在线数据下载。
4. 韩国工业产权局(KIPO)KIPO
KIPO面向公众的专利信息服务委托韩国专利信息院(KIPI)负责,KIPI建立了韩国专利信息服务平台(KIPRIS)。目前,KIPRIS为公众免费提供国内外主要国家和地区的专利信息检索服务。其在线检索界面非常友好,注册用户还可以保存检索语句、建立个人文件夹,并可以单件下载。虽然KIPRIS没有建立开放数据平台,但其页面上设置有对检索关键词、专利类型在内的实时检索统计,显示了其在专利信息服务方面同样存在与用户互动的需求。
(一)互联网时代的商业生态系统
社交网络FacebookkFacebook:全球最大的社交网络平台,成立于2004年2月,2012年5月在美国纳斯达克证券交易所上市,市值达1151亿美元,2013年四季度财报显示,月度活跃用户数达12.3亿。在成长初期通过开放1.3亿用户档案和关系数据,吸引了众多的程序员、创业团队和游戏厂商开发相关应用。仅一年多时间,网站聚集了20多万开发者、4.5万个应用,用户数随之迅猛增长,Facebook一跃成为全球最大的社交网络,其开放平台也帮助诸如ZyngalZynga:著名的游戏公司,2007年6月创立,借助Facebook等社交网络平台声名鹊起,开发了FarmVille(开心农场)等多款热门游戏,2010年营收达到8.5亿美元,净利润4亿美元,2011年12月在美国纳斯达克证券交易所上市,市值达67亿美元。这样的优秀团队获得巨大成功。开放平台重构了网站与用户间原有的生态链,营造了网站、开发者和用户三方多赢的生态环境。
在国内,阿里巴巴集团2008年提出定位电商开放平台、打造大淘宝生态系统的“大淘宝战略”。2010年底,开放平台上已拥有11万开发者,产生3.6万个线上应用,API日均调用7亿次,当年第三方应用收入即达1650万元。2013年,阿里巴巴全年零售总额达到1.5万亿元,占全社会消费品零售总额6.6%,其无线端开发者收入超过5亿m相关数据来源2014年阿里巴巴集团IPO招股说明书。。阿里巴巴集团正是基于开放平台理念,吸引了众多第三方服务商为淘宝卖家、中小企业提供个性化产品和服务,按照社会化分工协作方式,把整个电商链路打通,成功打造出极具活力的电商生态圈。
现代商业生态系统理论认为,系统的运作或动力不是来自系统外部或系统的最上层,而是来自系统内部各个要素或各个子系统之间的相互作用。与自然界生态系统类似,商业生态系统是一个复杂适应系统,具有自组织的特征,鼓励多样化,建立共生、共享、共赢的生态关系,实现价值创造。n[英]Lewin Roger、[英]Teresa Parker、[美]Birute Regine, Complexity Theory and the Organization:Beyond the Metaphor,Complexity,1998.3(4),36-40。
(二)依托专利数据开放平台打造知识产权行业生态圈
构建专利数据开放平台,犹如为知识产权行业引入活水,释放行业活力,使重构知识产权行业生态系统成为可能。政府部门、服务机构和用户将在生态圈作用下逐步形成互利共赢的和谐共生关系,专利信息在马太效应与罗宾汉效应o马太效应(Matthew Effect):为数不多而信息需求量较大的用户,随着时间的推移,其信息需求量将愈来愈高于平均水平。这部分用户在行为上表现为力图占有数量更多、内容更新的信息资料,但在信息资料来源不充分的情况下,势必会影响其他用户的信息需求与利用。这就是信息需求中“穷者愈穷,富者愈富”的马太效应。的共同作用下推动行业健康可持续发展,有力支撑国家知识产权战略实施。
1.政府部门立足宏观,丰富手段科学管理
在行业生态圈中,政府的中心角色、主导作用弱化,基础作用、服务职能被加强。专利数据开放平台拓宽了基础专利数据的公开渠道,在政府信息资源公开最大化的同时,进一步激发社会对专利数据的关注和利用,实现专利信息利用效能的最大化,发挥专利信息服务对知识产权制度运转的重要支柱作用。
基于开放平台产生的众多应用也将对政府的宏观管理和科学决策大有裨益。例如,优化的专利检索分析工具、专注细分领域的专利信息追踪、授权专利互动评价等应用将有效促进总体专利质量的提升;建立数学模型分析专利转让许可等历史信息,可以对相关领域专利的价值评估提供参考,这一应用尤其可配置在专利展示交易平台上;接入微信、淘宝等大众移动应用,通过查询接口帮助消费者及时辨别商品专利信息真伪并实时举报,从而将打击专利侵权从集中行动式转为普及化、常态化;第三方服务机构获得企业在开放平台上的授权后,可实现对企业专利事务的托管或协助管理,特别是当专利数据开放平台整合电子申请系统、电子申请交互式平台、甚至专利审查系统数据后,具有代理资质的机构可以实现服务效果的极大提升。
2.行业内部积极创新,协作竞争繁荣发展
专利数据开放平台将大大消除很多专利信息服务业务的进入壁垒,使信息检索分析、数据加工、文献翻译、数据库建设、软件开发、系统集成等开发变得快捷而多样,继而为知识产权代理服务、法律服务、商用化服务、咨询培训服务等业务群注入生命力,实现全行业的良性交互、共同发展。
在知识产权行业生态圈中,成员以协同关系共存,彼此既是竞争对手,也是合作伙伴,还是服务对象。随着用户数量的增长,成熟机构不断整合、拓展业务范围,在运营和创新方面获得更高效率,同时,新兴公司、新生业务也将获得更广阔的创业空间。可以预见,生态圈的内生活力和创造力将突破现有知识产权服务范畴的局限,将专利数据的效用延伸至管理、财务、投资等领域,更好地为实现企业的商业目标服务,产品和服务的价值将得到前所未有的提升。
3.行业外部跨界融合,共享资源输出价值
评估商业生态系统健康与否的三个标准就是,能否将技术和其他创新性原材料持续转变为更低的成本和新产品;能否通过创造有价值的新功能,增加有实在意义的多样性;新兴技术事实上在多大程度上正在被应用于新业务和新产品。p[美]马可・扬西蒂、[美]罗伊・莱温:《制定战略:从商业生态系统出发》,载《哈佛商业评论》2004年4月号。
以新技术手段的融合运用为例,专利信息服务未来的竞争点就集中在是否最有效地利用了神经网络、人工智能、语意分析、数据挖掘、可视化、大数据等新兴数据分析技术,能否支持移动互联网、下一代互联网、云计算、物联网等新技术的应用开发。再以信息资源的融合共享为例,竞争点就在于能否将专利信息与科技文献、法律信息、商业信息等信息资源整合应用,为创新主体提供全方位、一站式服务支持。
专利数据开放平台将互联网思维和市场机制引入知识产权行业生态圈,将用户思维贯穿到极致,有助于形成跨界融合的理念,吸收引进外部技术、人才、信息、金融等稀缺资源,同时向外界输出多样化的知识产权资源和服务,实现行业飞跃式发展。
专利信息记载了人类社会发明创造的成就和轨迹,是现代社会最重要的技术文献和知识宝库,也是在不断加快的全球经济一体化进程中进行市场竞争最有力的武器。当前,世界各主要经济体,尤其是美欧都在专利信息利用方面做了大量工作,加大数据开放力度,提高数据使用效率。我国政府亦应充分利用互联网的思想和技术,推动实现专利工作从工业化思维到互联网思维、从政府主导到市场调节、从单一价值链到行业生态圈的转变。
对比传统经济,新经济正在以比我们想象的快得多的速度增长,科技革命对众多产业,包括政府公共服务都将产生影响。我们相信,数字化将重构新商业,未来的企业一定程度上来讲都是互联网企业,政府部门也应在新科技革命浪潮下,抓住时代变革的脉搏,为公众和行业打造一个富有生命力的生态圈。而这一切,将首先有赖于政府部门及相关决策者具备三种意识:开放、共享和创新。
With the advent of the internet era, technology innovation is developing rapidly. Meanwhile, many unprecedented business models are created. Not only that the way we think in mind gets gradually overturned, but the organizational pattern in reality is transformed as well. The internet thinking challenges much to traditional industries, and it also shed a new light on the public management of government. Through the investigation and the thinking on the system of patent information utilization, this article puts forward the concept of constructing patent data open platform. Based on such fully open of the patent data, the efficiency of the promulgation, dissemination and utilization of patent information can be signifi cantly raised. Furthermore, the IP industry will get renewed and become more vigor and vitel and grows into a healthily developing ecosystem of mutual benefi t and win-win results.
patent data open platform; patent information; big data; IP service industry; ecosystem of IP industry
于大伟,国家知识产权局专利审查员