刘民
摘 要: 从电网企业竞争情报需求入手,以广州供电局为例,探讨了电网企业竞争情报平台的研究和实现。结合最新的大数据、资源整合、可视化、文本挖掘等技术,对平台的功能、创新应用和服务进行深入的分析,并就其关键技术特别是元数据资源整合、基于大数据的知识发现等进行了深入讨论。最后提出了一个先进、高效的电网企业竞争情报平台解决方案,既能满足电网企业的竞争情报需求,又利用新技术提升平台的功能和服务。
关键词: 竞争情报; 电网企业; 大数据; 可视化
中图分类号:G350 文献标志码:A 文章编号:1006-8228(2019)03-98-04
Research and implementation of power grid enterprise competitive
intelligence service platform
Liu Min
(Electric Power Test Research Institute of Guangzhou Power Supply Bureau Limited, Guangzhou, Guangdong 510410, China)
Abstract: Starting from the demand of competitive intelligence of power grid enterprises, this paper takes Guangzhou Power Supply Bureau as an example to discuss the research and implementation of the competitive intelligence service platform for power grid enterprises. Based on the latest technologies such as big data, resource integration, visualization, and text mining, the functions, innovative applications and services of the platform are analyzed in depth, and the key technologies, especially metadata-level resource integration and knowledge discovery based on big data, are discussed in depth. Finally, an advanced and efficient solution of competitive intelligence platform for power grid enterprises is proposed, it can not only meet the competitive intelligence needs of power grid enterprises, but also use new technologies to enhance the functions and services of the platform.
Key words: competitive intelligence; power grid enterprise; big data; visualization
0 引言
電力行业作为国民经济发展重要的支柱行业之一,是世界各国战略发展的重点,电力行业竞争情报的发展至关重要[1]。随着电力市场的发展,电网企业在智能电网建设,新能源挖掘、发展以及对环境的影响等方面都面临竞争[2]。竞争情报源于20世纪50年代[3],美国90%的公司拥有自己的竞争情报机构,全球500强企业中,几乎所有企业都设有专门的情报部门,其中95%以上的企业建立了比较完善的竞争情报系统[4]。2011年,南方电网建设了共享数据平台的全网一级主站系统,开展具体技术管理和协调工作,整合南方电网科技情报资源,逐步建立南方电网四级技术情报中心,提供全方位的技术情报服务[5]。
广州电网目前已成为全国供电负荷密度最大的城市电网之一,在发展过程中积累了许多科技成果、专利、技术标准和技术报告等优质科技情报文献。该类资源由于版权和文献原文价值等原因而不适合全部在南方电网公司技术情报中心共享,缺乏资源共享的平台。因此,亟需构建一个具有广州电网特色的,积累电网创新方面的科技文献供全网知识共享的情报系统,使科技情报工作充分发挥最大化效益。
1 平台建设目标
总体需求分析如下:通过运用异构数据整合技术、文本挖掘技术等先进技术构建一个具有电网企业特色的分/子公司情报子系统,集成广州供电局乃至电力行业各类电力情报资讯,实现对企业、行业的情报管理和应用。以子节点的形式,依托南方电网科技云服务平台的标准化资源体系,将子公司的资源整合到公司情报中心文献题录总库,从而建立起情报中心二级联动运维合作和公司内部情报得最大化整合。针对广州供电局多年积累的特色资源,以电力行业定向聚类各种资源信息,建设重点领域专题库,充分发挥该领域的技术优势。
预期目标如下:①在数据库建设和完善的基础上,进一步整合优质资源,深度挖掘加工,开展电力产业专题服务,专项调研;②实现基于学科主题、关键词等信息的个人定制与自动推送,并采用最新的文本挖掘技术,通过对内容的语义分析、统计等各种智能处理手段,对中文以及其他语种信息进行了更加深入的挖掘和利用,从而为系统提供高附加值的信息服务;③支持千万级数据量的检索,并在大规模数据量级别上提供理想的高性能和高处理效率。
平台能对来源、媒体类型、数据库结构、存放地点各异的各类科技文献资源、科技资源信息、科技动态信息等有效整合,构建信息资源数据库群,实现统一存储、管理、检索、输出、服务的信息服务平台。
2 平台创新应用与服务
2.1 SNS个人知识管理
构建个人知识管理平台。个人用户可以在线添加感兴趣的文章、期刊等等,上传研究资料与成果数据,关注具体的知识对象(领域、主题、专家、机构等)。同时可以在线添加好友、查看好友动态、好友信息、好友感兴趣的资料、好友正在研究的课题等,通过一系列SNS社交化功能,促进个人用户与同趣用户产生互动,形成有意义的新知识。
2.2 大数据综合趋势分析
运用大数据分析对各对象的趋势进行预测。平台可提供对电力行业“研究领域”“主题(研究课题)”“基金支助”“传媒渠道”等多方位多对象的趋势分析,趋势可回溯等,从多个维度客观反映趋势的变化,并以可视化图表的形式呈现。
2.3 机构内部评估分析
支持机构特色资源、科学数据的整合扩展。提供机构创新智能工具,实现报告、提科研比对分析、信息决策等。
2.4 情报挖掘服务
基于广泛的资源发现基础,从情报分析视角深入挖掘隐含知识关联。支撑学科评估、人才评估、研究方向分析、競争情报动态连续追踪。将资源按照产业门类、知识概念总分关系进行关联组织,解决传统资源服务按照数据库门类导航的弊端,使资源和信息可以更有针对性地辐射到各个领域。对学科邻域进行深入的评估分析,帮助机构学科的建设。对机构主要研究方向进行深入的评估分析,帮助机构合理地选择研究方向,以及进行行业对比。
情报服务包括以下方面。
⑴ 科学指标:基于引文评价的事实型数据库,通过多维度的计量分析及大数据挖掘,帮助用户了解电力行业的高影响力论文、学者、机构、主题等,跟踪行业的最新发展趋势。
⑵ 文献检测:基于论文检测系统的全文本比对检测平台,集合了VSM+、语义指纹、自动分类等三种方式的计算模型,基于南方电网技术情报中心和广州供电局的自建数据资源,科学开展查重检测,以辅助科技项目立项、论文撰写、成果评定等。
⑶ 考试题库:基于各类电力职业考试的全真试题和模拟试题,并提供权威的试题解答和详细的知识点分析。帮助需要参加电力专业考试的用户进行系统的考前练习和专项练习,支持管理员自行添加试题及组织在线考试功能。
⑷ 原文传递:提供标准的基于线上流程化的情报服务申请管理流程,用户填写并提交服务申请表。管理员会通过后台“服务处理”查询到该申请,将准确的检测结果发送到用户邮箱。
2.5 对象化与可视化图谱
传统的数据资源获取仅仅通过资源的检索排序,无法呈现各个资源或知识对象之间的联系,无法呈现由文献到知识对象的关系,用户难以从其他维度考量文献或知识本身的权威性、关联性等,妨碍了用户对获取的知识资源的“判断”。
系统通过对海量基础资源的分析与运算,建立起了亿量级的数据关系,并采用国际领先的可视化图谱方式呈现,为用户打造了全新的可视体验,从而帮助用户快速了解电力行业及相关行业的研究前沿主题情况,深入发掘主题关系链中的内在知识关联和继承关系。
2.6 人才评估分析
通过情报挖掘服务,获取大量的分析型数据,从而为平台调研、机构评估、人才引进、研发创新评估等决策的支撑。大数据的挖掘和应用,能大大减轻情报分析人员的工作量,提高情报分析的效果,以事实数据为基础,以科学分析方法为形式的情报资源,更加具备说服力和可靠性。
2.7 调研辅助
调研小组可在本系统中创建调研工作流、定义平台的基本信息、授权调研小组成员等。调研小组成员通过具体分工创建各自的子工作流,并利用本平台的资源以及各种分析工具,获取事实型数据,以及更深层次的分析型数据、报告等。
调研小组长拥有工作流分发与合并的权力,通过对平台调研涉及的各个环节的综合控制,工作流的梳理,形成平台整体的多维数据管理以及关联分析和可视化的效果的调研数据库,成为平台调研分析报告的重要组成部分以及平台申报的重要依据。调研过程中,系统根据调研的具体内容和属性自动推送资源与信息,全程无需人工干预,并运用具有行业领先水平的文本挖掘、数据清洗等从而为科技创新及公司发展提供决策依据。
3 平台关键技术及其实现
3.1 元数据级资源整合
传统的跨库检索的异构整合模式存在种种弊端,基于元数据底层整合的资源整合已成为业界主流。平台采用了元数据层级的底层整合方案,彻底解决了异构资源、标准资源、自建资源的整合问题。
由于各种类型的资源或信息差异较大,不能用一种通示的数据加工规则予以约定。因此,需要将资源以一定的批次和类型进行元数据化处理,然后根据已设定好的规则对元数据进行自动加工,从而生成相对规范的数据集群,多个这样的集群通过类型或属性的标引在数据库中得以区分和共享,其格式、描述、存储形式等需全部满足数据分析与挖掘的基本条件。元数据整合作为泛资源存储和管理基础,解决了资源差异化和渠道来源等问题,为进一步的数据分析、挖掘、组织与推送等奠定了基础。同时,元数据定制加工是可以面向对象的,既可以针对主体对象提供广泛的资源发现,也可以针对特有对象提供特殊资源发现。
异构数据系统是相关的多个数据库、数据集的集合,可以实现数据共享和透明访问,每个数据库、数据集在加入异构数据库系统之前本身就已经存在,拥有自己的数据库管理系统。情报资源建设涉及到多种自产资源,这些资源数据的来源和格式均不相同。在保证各原始数据系统的完整性和可访问性的前提下,如何将这些数据进行整合,形成一个整合的资源库,以向情报系统提供跨库检索的数据支撑,这是平台时间资源整合的关键。平台从结构化、非结构化数据存储的兼容性入手,对题录数据、原文数据采用不同的方式进行保存并建立二者之间的映射关系,并采用中间件技术的思想对不同格式的数据进行加工,将加工后的数据以统一的格式存储,从而对情报系统的数据检索提供高效的检索支撑。
3.2 基于大数据应用的知识发现
平台的源数据总库整合了包含期刊、学位论文、会议论文、专利、专著、标准、科技成果、产品样本、科技报告、政策法规等中外文文献元数据3亿余条,资源覆盖了近20年来国内产出中外文文献资源的95%以上。基于海量元数据资源,通过对数百亿数据关系的挖掘,系统解析出多个维度的文献资源知识对象,包括领域、主题、学者、机构、传媒、资助等。其中挖掘整理了近千万人物、20万机构、200万主题和数万个资助及传媒,同时呈现的 10亿数据关系可以方便用户通过平台得以直观使用。在确保海量大数据资源的发现与获取同时,更能通过对象化与趋势的解析,让用户了解到各个领域的趋势和热点,为研究者和分析人员提供基于事实基础的深度知识服务。真正的实现从“发现并获取资源”到“发现并获取知识”的过程。
3.3 资源检索及发现获取
检索应用的历史已有几十年之久,互联网的发展亦导致了检索应用趋势的大变革,未来检索的应用趋势越来越倾向于“体验”“准确”“分面”。因此,平台采用简洁的一站式检索,为大多数用户提供良好快速的应用体验,并深究元数据的质量,从底层数据与构架上确保检索的准确性。另一方面,通过对象化的解析,使分面检索更为直观易用。引导用户从“检索资源”到“发现知识”的转变。主要包含以下几个方面。
⑴ 简洁易用的一站式检索:用户既可以在页面上的基本检索框中输入检索条件进行检索,也可以在任意时候随时呼出高级检索悬浮窗进行高级检索。
⑵ 检索结果分面及再检索:具备将检索结果分面聚类、主题词扩展推荐、检索结果再次组合检索等功能,用户可以对检索结果进行进一步的筛选。
3.4 V_Link多途径全文保障服务
在元数据整合的前提下,“开放获取”成为了现实。因此,平台提供了“V_Link 多种途径的全文保障服务”,全文获取不再局限于唯一的通路途径,而是呈现出多个存储路径,用户能够按照自己的意志选择从“什么地方”获取该资源;另一方面,资源的来路也不再局限于“本地镜像”或“网络包库”,一切可获取该资源的通路,都将被V_Link服务呈现出来。
本平台中,V_linK可实现将资源获取途径延伸到公司本地自建资源、公共资源、商业数据库资源、以及其他一切可用的相關资源。除了支持资源的“在线阅读”与“下载”外,还能对接本平台的参考咨询服务,以及外部的原文传递服务,支持以更加主动的方式获取全文。
4 结束语
本文从广州供电局科技情报的需求入手,研究了特大型电网企业的竞争情报平台建设的目标、功能、创新应用和服务,并就其实现的关键技术进行讨论和实现。通过采用元数据资源整合、基于大数据应用的知识发现、对象化和可视化图谱等新技术和创新理念,实现了竞争情报中心作为公司生产运行、设备管理、科技创新、战略决策的专业智囊,并提供先进技术追踪、设备资产管理等情报的监测搜集、整理加工、统计分析与咨询服务等工作的目标。
下一步,将在进一步深化系统应用的基础上,并探讨深入结合大数据和人工智能等技术,提升竞争情报平台的数据分析能力和智能化水平,实现对情报更好的发现和使用,并提供更加智能化的情报服务。
参考文献(References):
[1] 周育忠.电力企业数字图书馆建设的探讨[J].广东电力,
2009.2:35-36
[2] 黄慧红,张显聪.电力企业竞争情报面临的挑战及对策研究-
以南方电网情报中心为例[J].图书情报知识,2016.2:32-33
[3] 许明金.竞争对手情报的采集与分析[M].海南出版社,2008.
[4] 李兵.浅谈企业竞争情报工作[J].技术与市场,2009.1:57-58
[5] 杨柳.大型电网企业凝炼关键情报课题的途径与方法[J].图
书情报知识,2015.4:28-31