知己知彼 百战不殆
——专利信息在企业运作全流程中的运用

2012-11-10 02:03吴巧玲金少军
华东科技 2012年1期
关键词:医药数据挖掘专利

文/吴巧玲 金少军

知己知彼 百战不殆
——专利信息在企业运作全流程中的运用

文/吴巧玲 金少军

专利作为企业保护自身技术成果的重要手段,不仅是企业形成技术创新能力的保障,还是占领市场竞争制高点的有力武器。运用专利信息,不仅可以缩短研发的周期与投入的资源,节省技术开发成本,还可以了解技术的发展现状,为技术趋势预测提供基础信息,构建企业的持续竞争优势。据世界知识产权组织统计,企业充分利用专利信息可以缩短研发时间60%,节约研发经费40%。我国已成为世界贸易组织(WTO)的成员国,国内企业将在经济全球化的过程中参与激烈的市场竞争。因此,专利信息在企业运作流程中的应用,能够有效的提高企业的创新和竞争能力,使企业在激烈的市场竞争中占据主动地位,即便是处于竞争劣势的企业,也可以通过有效的专利信息运用建立相应的预警机制,保护企业免受或降低竞争中的损失。正如微软公司总裁比尔•盖茨所指出的,一个企业收集、管理及运用信息的方式,将决定这个企业的输赢。专利信息管理作为当代企业管理的基础项目之一,也是企业从商业战略高度规划和实施专利战略的基础和核心,在整个企业管理系统中处于非常重要的地位。

开发利用专利信息 推动企业创新发展

企业专利信息是指企业在生产经营过程中获得的与专利相关的技术信息与法律信息。在当前以知识与信息为基础的市场经济环境下,专利信息已成为企业了解竞争对手与竞争环境,制定和实施有效竞争策略的有力武器。国外一项针对公司企业专利信息利用原因的统计调查结果表明:在335个调查对象中,利用专利信息获取竞争情报企业占到了51%,45%的企业利用专利信息保护本企业的专利,25%的企业用于技术创新。由此可见,专利信息已成为企业参与市场竞争过程中最重要资源之一。

专利信息的运用可以帮助企业获得有利的竞争情报,企业可以从竞争对手的专利申请中挖掘出有用的技术信息与经济信息,了解竞争对手的研究动向,调整自身的发展方向,有效避免企业侵犯他人的专利技术。另一方面,在有效仿制的基础上,还可以进行相应的技术创新,获得自主的知识产权,对于已经获得自主知识产权的企业,也可以充分利用专利信息监视国内外本领域的专利申请新动向,对于侵犯自身权利的他人专利申请,可及时向国知局提出撤销请求或提出宣告无效请求,以排除不应授权的专利。企业的科研人员在研发各环节也应注意运用专利文献,充分发挥专利信息作用,通过分析专利文献,选择高起点及新的科研领域,避免重复投入。

企业专利信息运用方法体系可主要分为专利信息收集与专利信息分析方法两大块。专利情报分析是以专利信息收集为基础,借用其它相关领域的知识和手段来实现的。企业研发人员主要是从文献中抽取大量的专利信息,利用相关统计方法并结合相关经验从而窥视文献中隐含的专利情报,来为企业进行技术创新实践及革新管理模式并掌握同行业相关信息提供帮助。

企业专利信息运用存在问题

据调查,目前善于开发利用专利信息的企业占总数少于10%,大多数企业不懂得利用专利信息的重要性,不善于从专利信息中了解竞争对手的技术水平,更谈不上利用专利信息来指导企业的技术开发和生产经营。国内的企业大多以仿制为主,很少有具有较高创新性的发明专利申请,整体的技术水平偏低。另一方面,我国企业对于专利信息的重视程度依旧很低,很少有企业设立独立的知识产权专利信息服务部门,专利人才与资金所占企业运营的比重很小。同时,由于专利法律体系的尚未完善,专利的法律保护力度不够,也导致许多企业对于专利制度的功能产生质疑,造成了企业专利信息工作开展的障碍。

随着计算机网络的普及,国内已经引进了许多专利文献系统,出版了系统化与网络化的计算机专利信息检索工具。但是,企业能够获得的专利信息检索途径依旧很少,大多数企业目前还只是从国知局出版的专利公告、专利说明书,科技期刊文献以及互联网普通检索来获得专利信息。这样获得的信息缺乏系统整合,内容较为零乱,有些重要的信息可能因为检索方法的差异而被遗漏,不利于发掘专利信息中的核心内容。在实践中,由于缺乏专业的信息分析人员,企业的专利信息分析多半停留在检索专利等浅层面上,往往是“懂技术的不懂专利,懂专利的不懂技术”,基本上采用简单下载与人工阅读方式,无法进行数字化查询比对与专利信息的数据共享,分析面窄,深度不够。部分企业虽花费巨资引进某些功能较为完备的专利信息分析软件,同样因为缺乏专业的操作人员,而使其不能很好的发挥作用,效果大打折扣。

开发企业专利信息运用新方法

鉴于我国企业在专利信息运用上的诸多问题,我们提出了基于数据挖掘的企业专利信息运用新方法。以便企业能够根据自身的目的,利用已有的资源对专利信息和文献进行灵活的归纳、整理和分析,以便从中提取出企业期望了解的各种信息,并将分析处理结果运用于到企业的发展规划与辅助研发中去。

所谓数据挖掘(Data Mining,DM)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道、但又是潜在有用的信息和知识的过程。目前,在互联网上能够检索到的专利文献就已经超过4000万篇,如果想在如此浩瀚的专利文献中,找出企业需要的有价值信息,仅仅才采用人工分析是几乎不可能完成。而专利数据挖掘是以各国的专利数据库以及期刊文献为研究对象,通过集成化、数据化处理专利信息,归纳分析,识别出有效的、潜在有用的知识,找出专利数据库中各相关记录之间内在潜在关系,描绘出专利进化的趋势与轨迹的一种方法。一般来说,专利数据挖掘通常由企业中具备专业知识和技能的专利信息人员或技术专家来开展,一般按照确定相应的检索策略;对检索结果进行统一的标准化处理,保证数据分析与关联的准确性;利用相应的专利数据挖掘分析软件对标准化处理过的检索结果进行数据分析;对分析结果进行解释,并且做出分析评估报告四个步骤来进行。

知己知彼,百战不殆

以医药领域的中国专利数据为例,对专利情报数据挖掘方法进行实证研究。对该领域进行了管理层面和技术层面的深入分析,并以可视化图表的形式展现分析结果。

首先以中国国家知识产权局专利数据库公布的自1985年10月至2010年12月的所有专利申请数据作为数据源,利用信息提取技术从专利数据库中抽取研究领域的发明专利作为原始数据,并建立原始数据库,根据医药领域的特点结合专家意见确定我国医药领域的关键技术名词,并在中国国家知识产权局专利数据库检索页面的摘要和题目字段中进行检索,形成我国医药领域原始专利数据。然后对原始数据进行数据抽取、清洗与转换等预处理,最终形成我国医药领域的专利分析数据库,其中包含1985年至2010年的有效专利总数为28136条。

其次采取OLAP分析与分类分析相结合的专利挖掘方法,对我国医药领域专利主专利分类号(主IPC)排名前十位的技术及年度分布的状况进行深入细致的数据挖掘。高产主IPC的分布状况分类采用K近邻规则分类法,根据分类结果得出分析结论,并制成可视化图表;在此基础上,运用OLAP技术对上述高产主IPC技术的年度分布状况作进一步的剖析,挖掘出技术的发展趋势,得出更深层次的专利情报。

根据分类分析结果,采用OLAP技术进一步挖掘IPC排名前五位的技术年度分布状况。从医药领域IPC排名前五位的技术发展趋势分布图中,我们可以更清楚地看到IPC排名前五的技术发展趋势。医药领域的技术在国内的申请专利最早出现在1985年,主要分布在A61K(医用、牙科用或梳妆用的配制品)、C07D(杂环化合物)、C07C(无环或碳环化合物)3个部类。之后,医药领域各类IPC技术不断发展,申请专利数量在2000年以后迅速增多,并且都在2008年达到了最大值。同时可以很明显地发现,医药领域排名前三的IPC发展速度相对更快。其中医用、牙科用或梳妆用的配制品(A61K)的专利申请量一直持续发展,专利数量逐年增长,尤其在2001年之后增长迅速,成为医药行业的主要发展领域。化合物或药物(A61P)小类虽然出现的时间较晚,但在随后的几年里发展迅速,近几年,化合物或药物类的专利申请成为医药领域的发展热点之一,并在2000年首次超过了杂环化合物(C07D)领域,其后发展突飞猛进,成为医药领域专利数量仅次于A61K的领域。

医药领域IPC排名前五位的技术发展趋势分布图

对上述医药领域排名前五位的主IPC技术及其年度发展趋势分布的挖掘可以反映出专利申请人的经济利益趋向和市场开拓方向。医药领域研发主要集中在医用、牙科用或梳妆用的配制品(A61K)和化合物或药物制剂的治疗活性(A61P)上。由此可见,医药行业的企业可以通过专利信息的挖掘,避免在同一科研领域的重复研究,在研发过程中根据自身的特点,有针对性的调整研发方向,更多的将资源投放在研究相对不集中的领域,确定有价值的专利、产品领域或替代品,以获取更大的经济效益。

知识经济时代,专利信息越来越成为企业技术创新与前进发展的驱动力。一个企业应当重视专利信息资源的利用,有计划、有目的的收集和分析专利信息,不断提升其信息运用水平。同时,政府应当扶持具有专利战略规划设计能力与企业知识管理水平的专利信息咨询服务机构,为企业提供专业的个性化的信息服务,并且在政策上扶持企业开展专利信息应用。相信通过政府部门、信息服务机构与企业界的协同合作,专利信息一定会为中国企业的自主创新和国际市场的竞争助一臂之力。

作者分别就职于浙江省科技信息研究院、杭州民生药业有限公司

猜你喜欢
医药数据挖掘专利
专利
探讨人工智能与数据挖掘发展趋势
发明与专利
传统医药类非遗
基于并行计算的大数据挖掘在电网中的应用
医药下一个十年 创新为王
一种基于Hadoop的大数据挖掘云服务及应用
《中国当代医药》来稿要求
《中国当代医药》来稿要求
基于GPGPU的离散数据挖掘研究