沈阳工业大学信息科学与工程学院 张胜男 麻晓翠
专利引证分析的集成可视化方法
沈阳工业大学信息科学与工程学院 张胜男 麻晓翠
引证分析是专利分析的一项重要内容。针对大型层次数据在有限显示区域内的可视化问题,提出了一种基于改进Hyperbolic tree的专利引证分析的集成可视化方法。将传统的 Hyperbolic tree 和鱼眼技术相结合,提高了空间的利用率,同时辅以一系列的交互手段有效地解决了可视化区域节点遮挡,细节信息展示能力有限等问题。
专利引证分析;可视化;Hyperbolic tree
专利引证分析是指对专利的引用和被引用情况进行分析,是专利分析中的一项重要内容。通过研究专利之间的引证关系,可以发现特定领域中的核心专利、技术趋势,以及潜在的竞争对手[1]。由于专利信息数据量巨大,专利分析必须借助专业化的可视化分析工具。
现有的专利引证分析工具通常采用层次树或Hyperbolic tree进行分析结果的呈现[2]。然而,随着专利数据的不断增长,专利引证分析可视化技术变得越来越具有挑战性。传统的Hyperbolic tree可视化方法在引证分析方面存在多级专利信息揭示能力有限、节点密集区域存在遮挡、相关的专利细节信息的展示能力有限几方面的问题,因此本文设计了一个集成可视化模型,将Hyperbolic tree 和鱼眼技术,以及其他可视化技术相结合。集成后的可视化模型既可以揭示引证信息的整体布局,又可以显示局部节点的细节信息。
Hyperbolic tree基于双曲平面显示层次结构信息,不仅可以揭示整个树的层次结构,还可以把当前用户关注的部分用更多的空间来展示。Hyperbolic tree 技术主要由布局、映射和动态转移这三部分构成。其中,布局指依据递归运算将树形图的根结点设在双曲空间的中心,然后将根结点周围的扇形区域按照前述递归方法平均分给其子结点,以此类推可以保证每个结点的不重叠。映射是指用庞莱卡投影将双曲平面映射到欧几里得平面。动态转移的是指平滑的实现人机交互,提供信息导航功能。Hyperbolic tree 技术实现示意图如图1所示。
图1 Hyperbolic tree技术实现示意图
2.1 可视化布局
该模型的布局是将传统的Hyperbolic tree和鱼眼技术进行结合。鱼眼技术是基于人类视觉观察特性来设计的,可以将聚焦节点进行放大的同时缩小周边节点,这样既可以突出重点信息,也能够揭示信息的上下文关系。
将根节点置于整个显示区间的中央位置,而其他层次节点通过计算其相对于根节点位置的重要度来进行显示,从而让不同层次节点所占的空间沿着径向逐渐缩小。采用这种布局首先使得层次众多、容量巨大的树形结构置入有限区域浏览成为可能。其次,根节点放置在视图中央,分支依次呈放射状展开,并按照树的层级逐次减少分支的细节表达程度,用户可以转动整个树调整被显示的区域。处在区域中心的部分显示较多细节,处在边缘的部分细节被省略。这样不但可以解决多级专利信息揭示能力有限问题,而且还能将聚集节点放大的同时缩小周边节点,将更多的空间用来显示当前被关注的区域,很大程度得提高了空间的利用率。
2.2 可视化交互
专利引证可视化模型的另一核心要素是用户交互。交互式是用户通过与系统间的对话和互动来操纵与理解数据的过程。本文根据需求,在改进的Hyperbolic tree中加入了6可视化交互方式。
(1)焦点转移:使用者可以通过点击Hyperbolic tree中任一层次的节点将所关注节点移动到圆形显示区域的中心,处于中心的节点将被分配最大的区域,随着引证级别的加深,被分配的区域越来越小。
(2)视图切换:用户可以调整树的层次结构,将原始树变为简单的树形结构,从而有效地隐藏节点的详细信息。
(3)视点控制:以互不遮挡为原则,节点可在缩略显示和全名显示之间进行切换显示。
(4)细节显示:在纵览整体信息的情况下,交互式地选择一部分数据来对其进行特殊显示,便于用户确定感兴趣专利的引证脉络。
(5)Brushing:通过鼠标停留显示该节点信息的具体细节。
(6)投影参数设置:用户根据自己的需要定向的改变不同层次节点之间的距离,为不同的层次分配不同的显示区间,从而达到重点突出,周边兼顾的视觉效果。
2.3 多视图表达
传统的Hyperbolic tree中信息分析层次一般只能达到2级。为进一步展示节点的细节信息,本模型中同时使用overview和detail两种窗口,前者可以为用户提供整体的专利引证数据,便于用户对全局信息的大体判断,后者支持深挖细节,为此在detail窗口中添加了柱状图、折线图、饼状图。多视图中不同的可视化表达,方便了用户观察数据的不同属性。
图2 Hyperbolic tree交互式表达
以美国专利为背景,以新能源汽车为研究对象,检索出2004年至2014年的专利及其引文数据。部分Hyperbolic tree交互式表达如图2所示。
通过上述集成可视化方式,可以分析新能源汽车领域的专利布局,例如,查看专利被引情况、发现竞争对手、查看公司的专利布局、发现核心专利等。
专利引证分析的集成可视化模型结合了Hyperbolic tree和其他可视化技术,不仅解决了传统层次数据可视化中存在的多级专利信息揭示能力有限、节点密集区域存在遮挡、相关的专利细节信息的展示能力有限问题,而且使检索结果表达得更加清晰和丰富。本文方法可以应用在其他大型层次结构数据的可视化中。
[1]张兆锋,桂婕,乔晓东,等.专利引证分析工具的设计与实现[J].数字图书馆论坛,2010(9):20-25.
[2]刘玉琴,彭茂祥.美国专利引证可视化系统的设计与实现[J].计算机工程与应用,2012,48(22):34-40.
[3]李志龙,陈谊,赵建宇,等.基于双曲树的农产品分类信息可视化方法[J].计算机仿真,2015,32(2):436-440.
辽宁省教育厅科学技术研究项目(L2014049)。