智能矿井和数字矿山研究热点与前沿知识图谱分析

2021-01-14 07:30刘丽君
能源与环保 2021年1期
关键词:发文矿井聚类

侯 锬,刘丽君,赵 岩,刘 地

(1.陕煤张家峁矿业有限公司,陕西 榆林 719300; 2.西安科技大学 计算机科学与技术学院,陕西 西安 710054)

煤矿开采过程危险复杂,采矿条件也日趋复杂。我国90%以上的煤炭产量来自于井工开采,开采强度与规模的加大使采煤区地面塌陷严重。据统计,平均每采出10 kt原煤,就可使土地沉陷0.2 hm2,目前沉陷面积已达135万hm2,并以7万hm2/a的速度递增。而随着数据时代的到来,矿井智能化应用于多个领域,矿山智能化能极大地提高矿山生产效率,保证矿山的安全生产,减少生命和财产损失。所以,对于智能矿井的研究显得尤为重要,具有现实意义[1-3]。

知识图谱是近几年为大家所知的一个概念,在图书情报界称为知识与可视化或知识领域映射地图,是显示知识发展进程和结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及其相互联系。知识图谱对于大量的文献处理和可视化分析,对某一学科的文献、研究人员、研究机构、发文量、关键热词等具有独特功能[4-8]。

为了更加深入了解我国智能矿井探究现状和研究成果,更加清晰展现此方面文献的研究方向与趋势,以中国知网CNKI期刊作为数据库,选取“智能矿井”“智慧矿山”“数字矿山”“矿山智能”为主题的相关文献为研究对象,利用可视化工具Citespace和VOSviewer绘制知识图谱展开研究,以期为国内的学者对此方面的研究提供一些参考,帮助他们快速把握热点、掌握脉络。

1 数据来源与研究方法

1.1 数据来源

本文以CNKI期刊数据库,分别以“智能矿井”“智慧矿山”“数字矿山”“矿山智能”为主题词检索,筛选掉外文文献,选取1991—2020年的1 931篇中文文献,进行数据检索下载并整理。数据来源:CNKI数据库;检索格式:主题词=“智能矿井”“智慧矿山”“数字矿山”“矿山智能”;时间跨度:1991—2020;文献语种:中文;文献类型:期刊、会议。报纸、博(硕)士论文;精炼结果:1 931篇中文文献;检索时间:2020年3月28日[9-10]。

1.2 研究方法

本文采用Citespace和VOSviewer两种可视化分析软件[11-13]。

Citespace是一款着眼于分析科学文献中蕴含的潜在知识,并在科学计量学,数据和信息可视化背景下逐渐发展起来的一款多元、分时、动态的引文可视化分析软件,由美国德雷塞尔大学计算机与情报学教授陈超美使用Java语言开发的。本文采用的是Citespace5.6.R1.12.3版本。

VOSviewer是荷兰莱顿大学科技研究中心的van Eck和Waltman于2009年开发的一款用于构建和可视化文献计量网络的软件。本文采用的是VOSviewer_1.6.15版本。

2 研究的基本情况

2.1 发文量分析

基于CNKI数据库的检索结果,通过整理数据,利用Excel画出每年的发文量(图1)[14-18]。

图1 发文量时间分布Fig.1 Time distribution of published papers

从图1可以看出,发文量随着年份基本上呈递增趋势,而在2015—2017年出现大幅度下滑,原因是:2016年左右,全球经济陷入长期低迷态势,受此影响矿业市场也处于低迷态势,并且全国地质灾害多发频发。从2017年之后发文量逐步上升,2017年5月,国土资源部、财政部、环境保护部、国家质检总局、银监会、证监会联合印发《关于加快绿色矿山的实施意见》,体现国家全面推进矿山建设工作的意志,促使2018年发文量增加。2019年出现了发文量的高峰,原因是2019年3月,第十三届全国人民代表大会第二次会议审查并通过《关于2018年国民经济和社会发展计划执行情况与2019年国民经济和社会发展计划草案的报告》,批准了2019年国民经济和社会发展计划。计划提出,要组织实施新一轮技术改造升级工程,运用互联网、大数据、人工智能等新技术和先进适用绿色工艺、技术、装备改造传统产业。预计未来有关智能矿井的研究的发文量将会持续的增长。

2.2 作者分析

通过Citespace对作者进行分析,筛选发文量大于等于5篇的作者。Citespace的分析结果如图2所示。由图2可知,结点大小表示作者发文量的多少,连线的粗细表示作者之间合作密度。

通过VOSviewer对作者进行分析,筛选发文量大于等于6篇的作者,整理如下:①吴立新为30篇;②张夏林为11篇;③吴冲龙为10篇;④田宜平为8篇;⑤王李管为8篇;⑥汪云甲为7篇;⑦翁正平为7篇;⑧王凯为7篇;⑨何珍文为6篇;⑩张宇为6篇;陈国旭为6篇;杨可明为6篇;谭章禄为6篇。

图2 Citespace分析作者知识图谱Fig.2 Author′s knowledge map made by Citespace

结合作者发文量的知识图谱,可以看出发文量最多的作者为来自中国矿业大学(北京)的吴立新教授,吴立新教授主要关注矿山GIS、数字矿山等领域,主要从事MGIS开发与应用、矿山开采沉陷、遥感岩石力学和矿区环境可持续发展等领域的研究。他所发表的“论21世纪的矿山——数字矿山”“再论数字矿山:特征、框架与关键技术”等多篇论文,被大量下载和引用。除此之外,吴立新教授获得支持基金主要有北京市自然科学基金、国家自然科学基金、高等学校优秀青年教师教学科研奖励计划、高等学校博士学科点专项科研基金、香港研究资助局资助项目、国家重点基础研究发展规划(973计划)、高等学校优秀青年教师教学科研奖励计划。他发表的30篇文献中,13篇为第一作者,与杨可明、 汪云甲、王彦彬、车德福、马保东学者合作较为频繁,其中,吴立新教授与杨可明教授来自同一机构。

来自于中国地质大学的张夏林、吴冲龙、田宜平3位教授合作密切,共同发表论文3篇。

张夏林教授从事地学信息工程专业和地球探测与信息技术专业资源信息系统工程方向的教学与研究,获得支持基金主要有国家自然科学基金、国家重点基础研究发展规划(973计划)、国家高技术研究发展计划(863计划)、高等学校博士学科点专项科研基金。

吴冲龙主要从事地矿信息系统、数学地质、煤及石油天然气地质等方面的教学和科研工作,获得支持基金主要有国家自然科学基金、国家科技攻关计划、国家重点基础研究发展规划(973计划)、国家高技术研究发展计划(863计划)。

田宜平教授主要从事盆地模拟和三维可视化图形软件研究与开发,获得支持基金主要有:国家重点基础研究发展规划(973计划)、国家自然科学基金、国家高技术研究发展计划(863计划)。

来自中南大学的王李管教授发表的8篇论文里,均为第二或第三作者,王李管教授的研究方向有:采矿工程、岩土工程、数字矿山。获得支持基金主要有国家自然科学基金、国家高技术研究发展计划(863计划)、国家科技攻关计划、湖南教委科研基金云南省省院省校科技合作计划项目。

2.3 研究机构分析

通过Citespace分析研究机构的发文情况得到研究机构发文量统计结果:①中国矿业大学220篇;②中南大学57篇;③西安科技大学42篇;④中煤科工集团研究院36篇。

中国矿业大学作为发文量第一名的高产机构独树一帜,中国矿业大学的矿业工程为一级国家重点学科,获得支持基金主要有联合基金项目、青年科学基金项目、国家自然科学基金、面上项目、煤炭资源与安全开采国家重点实验室(中国矿业大学)开放课题基金。

中南大学的矿业工程为世界一流学科建设学科,获得支持基金主要有国家自然科学基金资助项目、湖南省研究生科研创新项目、国家杰出青年科学基金、联合基金项目、青年科学基金项目、面上项目。

西安科技大学的安全科学与工程为国家级重点学科、矿业工程、地质资源与地质工程为省重级点学科,获得支持基金主要有“973计划”项目、“863计划”项目、国家自然科学基金项目、面上项目、青年科学基金项目。

3 研究热点与前沿

3.1 关键词共现网络

本文以“智能矿井”“智慧矿山” “数字矿山”“矿山智能”分别为关键词从中国知网CNKI收集数据,并做数据清洗。将样本统计结果数据导入Citespace进行转换处理,将时间切片的时间范围设置年份为1991—2020年,时间切片为1年,Node Types选择Keyword。每个时间片选择Top50,连线强度选择Cosine。为避免个别结点过大,去掉“智能矿井”“智慧矿山”“数字矿山”“数字化矿山”等关键词后,生成如图3所示的以“智能矿井”等关键词共现网络图谱。

图3 Citespace关键词共现图谱Fig.3 Keywords co-occurrence map made by Citespace

图3中每一个关键词分别以节点展示,关键词出现频率的状况可通过节点面积的大小呈现,节点越大,关键词出现频率越高。关键词共现频率状况通过节点间连线的粗细程度表示。该知识图谱共生成349个结点,连线为989条,亲密度为0.016 3。Q值为0.534 6,S值为0.455 3。图谱中节点表示关键词,节点大小表示关键词出现频次,节点越大,关键词出现频次越高;节点之间连线反映合作关系,连线粗细反映合作关系强度,连线越粗,合作关系强度越大。借助Excel表格整理出中心度大于0的关键词的综合排名,次序为从左上到右下,综合词频和中心度2个方面因素,见表1。

结合表1与图3,除去“智能矿井”“智慧矿山”“数字矿山”“数字化矿山”等关键词,通过综合分析可知“物联网”“信息化”“大数据”“三维建模”“人工智能”“三维可视化”“三维地质建模”“虚拟现实”等关键词的研究热度较高。

3.2 关键词聚类

3.2.1 Citespace聚类结果

利用Citespace对关键词进行聚类分析,结果如图4所示。

表1 智能矿井热点关键词详细分析结果Tab.1 Detailed analysis results of hot keywords in intelligent mine

图4 Citespace聚类图Fig.4 Cluster graph of Citespace

不同颜色的节点和连线代表不同的聚类,#开头后面的文字为聚类名称,这10个聚类名称代表了智能矿井的具体热点领域,将10个聚类集合中具体的关键词整理,见表2。同质性反映同一个聚类中关键词的相似性,该值越大,聚类中关键词的相似性越高。平均年份为同一个聚类中关键词最早出现年份的平均值,用来判断聚类中引用文献的远近。

3.2.2 VOSviewer聚类结果

利用EndNote软件将文献格式转换为RIS格式,type of analysis 选择Co-occurrence,unite of analysis选择keywords,Counting method选择Full counting,最少出现次数选5,3 980个关键词中有259个关键词满足阈值要求。

表2 Citespace聚类详细情况Tab.2 Cluster details of Citespace

选取发文量超过7篇的文献,并筛选掉“数字矿山”“数字化矿山”“智慧矿山”“智能化矿山”关键字。原因是选取的1 931篇文献是以这些为名字查找的,且这样能避免个别节点过大(图5)。

图5 VOSviewer关键词共现标签视图Fig.5 Keyword co-occurrence tag view made by VOSviewer

节点大小表示关键词出现次数,名列前茅的有:“物联网”“矿井”“矿山”“应用”“三维可视化”“信息化”“煤矿”“矿山测量”“GIS”“三维建模”“可视化”“智能化”“地理信息系统”“大数据”“自动化”“单片机”“智能控制”“PLC”“人工智能”等。

图5可以直观地看到不同关键词之间的联系,不同的颜色表示不同的聚类,结合结果可知,聚合为10个类。

综合Citespace和VOSviwer聚类结果分析:“神经网络”“遗传算法”“虚拟现实”“模糊控制”“数据挖掘” “数据融合” “智能决策” “智能控制” “智能诊断”“CAN总线”等是 “智能矿井”的研究热点。

3.3 突现词研究

突现词研究可以得出该主题的研究趋势和热点研究方向,本文查找到的突现词如图6所示。图6中,第1列为关键词,第2列为所有文献中的最早年份,第3列为强度,第4列和第5列的年份分别表示此关键词出现最早的年份和最晚年份 。

图6 突现关键词Fig.6 Highlight keywords

关键词的共现密度视图如图7所示。图7中,项目即为关键词,每个点都有一个颜色,是指该点处项目的密度。一个点附近的项目数量越多,相邻项目的权重就越高,该点的颜色就越深,反之,一个点附近的项目数量越少,相邻项目的权重就越低,该点的颜色就越浅。

综合分析图6、图7的结果得出:“物联网”“可视化”“三维建模”“矿山测量”“信息化”“人工智能”“大数据”“智能化”“三维可视化”“地理信息系统”等是当前研究热词。“矿山物联网”“大数据”“云计算”“智能决策”“信息化”“人工智能”“可视化”将会成为以后持续研究的热点和趋势。

3.4 研究前沿

图8表示每年的关键词,圆圈为引文年轮,年轮的整体大小反映论文被引用的次数,引文年轮的颜色代表相应的引文时间。年轮越宽,出现的频次越大。可将对应颜色与最上方颜色渐变条对应查看。也可用最下方为每一年份查看每一年的热词。最早出现的点为这个类里的突现词,弧线的终点端为此术语结束时间。从图8中可以看出,除了“数字矿山”“智慧矿山”这些大的领域,“人工智能”“物联网”“大数据”“可视化”“数据挖掘”“三维建模”等方面的研究将会是以后的研究趋势。

4 结论

由于很多学术成果可能以其他形式呈现,故在CNKI上通过主题词检索出来的期刊,并不能完全代表智能矿井研究领域的所有研究成果,所以对国内“智能矿井”的研究现状分析和研究前沿预测有一定的局限性。但本文筛选的文献数量较多,能在一定程度上反映一些大体的规律,故而运用科学知识图谱对智能矿井的分析具有一定的合理性,综合上面分析结果得到以下结论:

近30年国内智能矿井的相关研究的高产机构大多集中在矿业为特色的高校或矿业类研究院,高产作者较为分散和独立,并且高产作者之间交流合作大多来自于同一个机构,即研究机构之间合作交流欠佳,不利于学术成果的创新和发展。

“物联网”“信息化”“大数据”“三维建模”“人工智能”“三维可视化”“三维地质建模”“神经网络”“遗传算法”“虚拟现实”“模糊控制”“数据挖掘”“数据融合”“智能决策”“智能控制”“智能诊断”“CAN总线”“矿山物联网”“云计算”等是近几年研究的热点,“人工智能”“物联网” “大数据”“可视化”“数据挖掘”“三维建模”等方面的研究将会是以后的研究趋势。

科学技术的不断创新和发展,将会推动矿井开采和安全领域的发展,两者之间的联系将会越来越紧密,而对矿井的研究也会不断走向无人化、智能化、数字化。

猜你喜欢
发文矿井聚类
矿井建设中的现场施工管理
高温矿井制冷降温技术应用与分析
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
面向WSN的聚类头选举与维护协议的研究综述
矿井通风系统安全性评价及其作用
改进K均值聚类算法
高瓦斯矿井防治瓦斯异常涌出措施的应用
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法