张连堂+严运广+周珂+黄祥志+陈前程+方鑫+李响
DOI:10.16644/j.cnki.cn33-1094/tp.2016.02.005
摘 要: 为辅助集群管理,根据Stuart K. Card等人提出的CARD信息可视化模型,对集群节点的连接信息进行实时展示,提出一种单中心集群中节点连接信息的动态可视化设计方案,简化了集群连接状态管理的复杂程度。实验表明,该方案在实现时消耗的内存资源较少。为大规模集群连接的信息可视化设计和实现奠定了方法基础。
关键词: 集群节点; 集群管理; 连接信息; 可视化
中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2016)02-14-04
Design of connection information visualization for cluster nodes
Zhang Liantang1, Yan Yunguang1,2, Zhou Ke1,2, Huang Xiangzhi2, Chen Qiancheng1,2, Fang Xin1,2, Li Xiang3
(1. School of Computer and Information Engineering Henan University, Kaifeng, Henan 475004, China;
2. Institute of Remote Sensing and Digital Earth Chinese Academy of Sciences; 3. Beijing Institute of Spacecraft System Engineering)
Abstract: To assist the cluster management, this paper put forward a dynamic visualization proposal of the nodes in single center cluster to show the connection information of the cluster nodes dynamically and timely according to the CARD information visualization model. It simplified the complexity of the connection state management. The experiment result shows that this method is less resource consumption. It laid the foundation for the design and implementation of connection information visualization for large scale cluster.
Key words: cluster nodes; cluster management; connection information; visualization
0 引言
集群是一组连接在一起完成特定功能的计算机的集合[1]。集群可以在成本较低的情况下获得较好的性能、较高的可靠性和灵活性。与集群交互时,集群像是一个独立的服务器提供服务。集群的一大特点是高可用性和灵活的伸缩扩展性[2],可以根据需要增加或减少集群中计算机的数量。
集群的组成一般可分为中心节点计算机(以下简称中心节点)和并行节点计算机(以下简称并行节点)。
中国科学院遥感与数字地球研究所研制的卫星遥感基础共性产品一体化处理系统是专门用来处理遥感信息数据的集群系统(下文所说的集群和集群系统都指该一体化处理系统)。本系统中的中心节点由三个模块组成,分别是通讯立方体、计算立方体、存储立方体。如图1所示,图中的总控调度服务器即是文中提到的中心节点,其他机器是并行节点。集群系统中的计算机都放在42U标准型机柜里,形成一种整机柜柔性服务器。集群系统是一种优化型系统,可以快速完成数据整编、共性产品生产、可视化检索等功能。系统主要采用自动化、标准化和业务化遥感数据处理模式,其中计算节点自动执行多项任务,简化了对服务器、存储器、网络及其他资源的管理与配置流程,是标准产品的高自动化生产系统,其可用性、容量和性能可满足行业不断增长的计算需求,为用户提供从硬件环境设计,到软件功能按需重组的一体化遥感产品处理系统整体解决方案。为了辅助集群的管理,根据常见的星型网络拓扑模型[3]提出一种集群节点的连接信息可视化设计的方法,用于直观的描述集群节点的连接信息。本文方法根据美国研究者Stuart K. Card等人提出的CARD信息可视化模型[4]对集群节点的连接信息进行可视化设计。信息的可视化可以使数据的呈现效果得到增强,让用户以非常直观的方式实现对数据的观察和浏览,亦可进行交互操作,发现数据中隐藏的特征、关系和模式[5]。参考CARD可视化模型的过程,将集群节点连接信息的可视化设计分为以下过程:首先要进行集群节点连接信息的获取,接着对获取到的集群节点信息进行数据预处理,根据这些信息建立节点连接信息表[6],中心节点根据可视化区域的信息生成一张可视化结构信息表,最后根据这两个表进行节点连接图的绘制[7],当用户把鼠标放置在图中的节点区域的上方时,显示该节点计算机的详细信息[8]。
1 集群节点连接信息的获取
本集群主要有中心节点和并行节点两种角色。首先运行中心节点上的程序,当中心节点的服务进程开启后,建立一张连接表,中心节点利用TCP协议开启监听进程,被动的等待连接;再依次打开并行节点,当并行节点上的程序打开后,就会主动向中心节点的程序发出连接请求。中心节点程序接收到连接请求后,将收到的连接信息进行预处理提取有用信息后放入连接表中,如有其他并行节点打开时,按照上述过程依次放入到该表中。建立连接表到绘图的整个过程都在中心节点上进行,当有3个节点连接时建立的连接信息表如表1所示。
表1中的各个字段都有其具体的意义和作用:编号字段为当绘图的时候统计共有多少个并行计算节点;IP为各个并行节点的IP地址,端口号为该并行节点和中心节点通信的端口;CPU利用率、内存大小、内存利用率和GPU信息可以作为集群决定为哪个并行节点分配任务的一个参考,辅助集群管理。
2 集群节点连接信息可视化的设计与实现
获取到节点的连接信息后,生成连接信息表格。集群的中心节点获取可视化区域的大小等信息后,生成一张可视化结构表的格式如表2所示。然后根据连接信息表和可视化结构表进行绘制,如图2所示。
设可视化区域的宽度为CW,高度为CH;中心加载图片的宽度为PW,高度为PH;边缘图片的宽度为pw,高度为ph。
可以求出中心点O的X坐标Ox=CW/2,点O的y坐标Oy=CH/2。
因中心需要加载的图片以O为中心点,可以求出要加载图片的左下角和右上角的坐标,从而把图片固定在中心位置。左下角设为A,其X坐标为:Ax=CW/2-PW/2,其Y坐标为: ⑴
同理可知右上角B的坐标为:
⑵
假设有n个节点连接,连接线的长度为r,如果想使节点均匀地分布在可视化区域内,连接线的一端是中心点O,根据三角函数算出连接线的另一个端点,这里先设第I(0
⑶
⑷
最后得出边缘各个图像的左下角坐标为:
⑸
右上角的坐标为:
⑹
半径r的取值范围为:
⑺
在参数pw和ph固定的情况下支持的连接数(也就是避免视觉混淆现象)的范围为:
⑻
本段描述实现快速计算图片中各个重要的绘图坐标点。
3 运行测试与结果分析
3.1 测试环境
本集群使用的是42U标准型机柜,机柜共放置10台机器,用其中1台作为中心节点,其余为并行节点。它们之间连接的网络拓扑为10台计算机与1台交换机直接相连的星型拓扑结构。
机器中的各个机器配置都相同,它们的IP配置如表2所示。交换机的配置如表3所示。
3.2 测试结果及其分析
由于集群系统中机器数目和交换机接口的限制,在测试时,分别取0个、1个、3个、5个、7个和9个并行节点进行连接测试:当无并行节点连接到中心节点的时候,只显示一个中心节点;当有一个节点计算机连接的时候,根据上述计算可以得到节点相对于中心节点的坐标,可得该节点处在连线的正右边位置,即处在以中心为相对坐标原点的正右方;当有三个节点的时候,这三个节点之间的夹角是2π/3,当有九个节点的时候,每两个相邻节点的夹角是π/3,当分别有1个、3个和9个节点的时(测试环境中可视化区域的长和宽分别是456像素和385像素。连线半径取值为192像素),当并行节点个数分别为1、3和9这三种情况下,连接图如图3所示。第三张图中一个IP为192.168.10.242的并行节点连接发生异常,节点失效,由此可见,集群节点连接信息的可视化设计可以方便的观察集群节点连接状态信息并发现失效节点,帮助更好的完成集群的管理。
当集群的并行节点分别有0、1、3、5、7、9个连接到中心节点计算机的时候,资源占用情况如表5所示。
综上,集群系统由于运行操作系统,开始会占用CPU和内存资源(CPU占用8%,内存占用190M),每连接上一个并行节点就会消耗一定的CPU和内存资源,通常情况下,当机器的负载超过80%以后,机器性能会迅速下降,影响任务的执行,接受测试的中心节点机器的内存是5824MB,CPU是八核心的,当连接个数不是很大时,经测定对CPU几乎无影响,可以忽略不计。经理论计算,目前理论上所支持的最大并行节点的连接数是(5824*1024-192500)/(10740)=537台。
4 结束语
集群节点连接信息的可视化设计采用一种动态绘制方法使集群中心节点和并行节点有规则的排列,这种方法可以用于集群节点的管理,方便用户及时查看集群节点的连接状态信息,帮助集群管理者及时了解集群节点的连接状态,更有效的对集群的节点进行管理。但是目前仅支持单机柜中的集群节点连接信息的可视化设计,下一步工作将通过使用分层和级联方法支持更多机柜中的集群节点连接信息的可视化,实现大规模集群管理的可视化。
参考文献(References):
[1] 向文.集群管理系统的研究与设计[D].辽宁师范大学,2008.
[2] 李敬.集群系统集中管理平台的研究与实现[D]. 西北工业大
学,2004.
[3] 田建勇.析星型拓扑设计组建校园局域网[J].安顺学院学报,
2011.13(1):90-93
[4] 杨彦波,刘滨,祁明月.信息可视化研究综述[J].河北科技大学
学报,2014.35(1):91-102
[5] CARD SK, MACKINLAY J D, SHNEIDERMAN B.
Readings in Information Visualization: Using Vision to Think[M].San Francisco; Morgan Kaufmann,1999.
[6] 陈建军,于志强,朱昀.数据可视化技术及其应用[J].红外与激
光工程,2001.30(5):339-342.
[7] 任磊,王威信,周明骏等.一种模型驱动的交互式信息可视化
开发方法[J].软件学报,2008.19(8):1947-1967
[8] 刘大海.海量数据可视化方法的研究[D].天津大学,2009.