魏利梅
摘要:随着当前网络信息技术不断发展,网络在社会上各个方面均得到广泛应用,并且发挥的作用也越来越重要,在社交领域的应用就是十分重要的一点,使得社交网络得以形成。在当前社交网络应用及发展中,越来越多的新技术得以应用,图数据挖掘就是其中比較重要的一种,因而对该技术进行合理应用也就十分必要。该文就图数据挖掘在社交网络中的应用进行分析,从而为图数据挖掘应用提供理论支持。
关键词:社交网络;图数据挖掘;应用
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)23-0031-02
在当前网络技术不断快速发展的大背景下,社交网络已经成为现代人们社交的一种主要途径及方式,也是必要手段,因而促进社交网络更好发展十分必要。在社交网络发展中,图数据挖掘的应用可使社交网络的作用及功能得以更好发挥,使社交网络能够在人们日常交流方面提供更好服务,因而应当对图数据挖掘加强认识,并且应当对其进行合理应用,使图数据挖掘得到更加理想的应用效果,为社交网络更好发展提供较好支持与保障。
1 图数据挖掘应用
1.1图数据库
对于图数据库而言,其属于新型数据库,这种数据库与关系型数据库完全不同,其主要就是对规模较大数据及不断改变需求进行处理,其所利用的主要就是图结构、节点及边与属性等相关存储数据。在社交网络中节点所代表的就是社交群体中个体,而边所代表的就是不同个体之间联系。就当前图数据库应用实际情况而言,应用比较广泛,而应用效果比较理想的主要包括Infinuite Graph、Neo4J、Dex、InfoGrid以及VertesDB、HyperGraphDB与Sontes等。
Infinuite Graph属于图形类数据库,这种数据库需要当作服务项目进行安装,这一特点与传统数据库比较类似。在Infinuite Graph数据库中对面向对象概念进行借鉴,因而数据库中每个节点及边线均可作为一个对象,特别是所有节点类均会扩展成为Base Vertex基本类,且全部边线类均会扩展成为BaseEdge基本类。Neo4J为开源图数据库,这一数据库属于比较先进的一种数据库,在实际应用过程中其选择直观图模型存储形式,以及以磁盘为基础进行持久储存,在数据库中具备较高可利用的分布式集群,通过利用Java可实现ACID完全兼容。同时,Neo4J数据库内核就是速度较快的一种图形引擎,具备数据库产品全部特点,如两阶段提交、恢复以及符合XA等特点。DEX属于具有较高性能的一种图形类数据库,具备比较理想的可扩展性,在实际应用过程中最多能够支持节点可达到100万,且能够支持.Net教程及Java教程。HyperGraphDB为开源数据存储机制,其是在BerkeleyDB数据库基础上而得以实现的,该数据库中图形模型为直接式超图形,就数学角度而言,超图形能够实现一条边线所指节点达到两个以上,与其他图形类数据库相比较而言,这种数据库能够对更多复杂结构进行处理。InfoGrid属于网页图形数据库,这种数据库所具备的一些功能就是面向网页应用程序,并且在OpenID项目中InfoGrid也具有一定应用。
1.2图数据挖掘算法及实现
在图数据挖掘中图数据挖掘算法属于核心内容,在实施图数据挖掘中具备决定性作用。就当前实际情况而言,图数据挖掘算法主要包括四种不同类型,分别为图查询算法、图聚类算法以及图分类算法与频繁子图挖掘。
第一,图查询算法。在图查询问题方面,相关研究人员提出GraphGreP算法,这种算法主要就是将路径作为特征结构,从而构建索引;而有些研究人员提出Glndex算法,这种算法就是选择频繁子图作为关键特点,从而进行索引;还有些研究人员提出TreePi算法,在这种算法中将生成树当作索引结构;同时,还有研究人员提出Tree+△算法,这种算法就是以树结构为主而判断图为辅实行索引。在大图上可达性查询方面,最早出现的索引方法为以区间编码为基础进行索引,之后通过对这种索引方法进行改进,从而获得GRIPP算法。
第二,图聚类算法。对于图聚类而言,其主要目的就是将具有相似性基于图结构相关各个顶点进行划分,使其归于集群中,而这些顶点相互之间存在联系,或者在集群中存在联系。就基于群体识别方面而言,图聚类主要包括两种类型,其中一种为对预定义节点间距离进行计算,另外一种为将最优聚类比聚类找出。对于当前图聚类算法而言,其主要包括层次方法、划分方法及最小生成树聚类算法。就划分方法而言,最为常用的就是k中心点算法及k-means算法。而层次算法的组成主要包括分裂层次算法及凝聚层次算法两种。
第三,图分类算法。在图分类方面,目前实际应用中主要包括两种类型算法,其中一种为图特征提取方法,这类方法中的代表就是FSG算法,另外一种为图核函数方法,这类方法中代表为CPK分类算法。对于图分类算法而言,其是在数据挖掘分类算法为基础而得以出现,并且得以发展的,相关分类算法由单一分类方法中可分为几种不同类型,分别为贝叶斯、决策树以及人工网络与K-近邻,还包括组合单分类方法中集成算法,不如Boosting及Bagging等。在实际应用过程中,通过改进这些算法结合图特点,可使其与数据挖掘实际需求更好适应,以实现更好应用。
第四,频繁子图挖掘算法。对于当前频繁子图挖掘算法而言,其分类方式主要包括三种,第一种就是依据模式挖掘算法输入类型,主要包括两种类型,即single-graph与graph-tranction;第二种就是依据所选择度量不同,分为三种,即支持度、支持度-置信度以及MDL三种;第三种为依据所挖掘出频繁子图类型,将其分为连通子图、一般子图以及诱导子图。然而,这些分类思路均以递归作为基础,对全部频繁子图进行挖掘,在此基础上将全部频繁集挖掘出来[1-2]。
2 社交网络中图数据挖掘的应用
在当前互联网媒体中,社交网络已经成为交流、交友的一种主要平台,并且也是实现资源共享及信息传递的主要方式,通过对其实行挖掘,可使其能够与用户实际需求更好符合,实现其更好应用。在实际应用过程中,为能够使这一目标得以较好实现,应当与数据挖掘特点相结合,有针对性地实行数据分类以及分析等相关研究,从而使社交网络能够更好服务于人们。
2.1社交网络中图数据挖掘应用背景及意义
随着当前社交网络不断快速发展,社交网络表现出指数级增长趋势,并且在数据方面也由以往单一字符型结构化数据发生转变,逐渐加入音频及视频等相关多媒体非结构数据,对于这些数据而言,随着人们表达及互动方式改变而逐渐发生改变。就当前人们利用互联网进行沟通方面,社交网络产生较大程度影响,比如在微博上对自身比较感兴趣相关话题进行搜索,搜索社会上名人比较感兴趣相关话题,通过向具有丰富经验的人进行学习,可使自身知识素养得以提升,而这些利用传统互联网工具无法实现。就当前社交网络发展情况而言,其在社会上各个行业及领域内均有着十分广泛的应用,通过研究社交网络相关领域,可对正确信息提取方法及技术进行合理选择,从而可将高质量丰富信息获取。在社交网络中,通过图数据挖掘技术的应用,可由结构化数据及非结构化数据中对各种不同类型信息及数据进行提取,并且能够对这些信息进行过滤,从而得到符合自身需求的相关各种数据。此外,对于社交网络而言复杂数据关系的一个集合,在对这些数据进行处理方面,利用传统数据挖掘方式会查询及分类等复杂程度增加,而利用图数据挖掘方式可实心信息筛选及分析,从而使传统数据挖掘中存在的不足及缺陷得以弥补。因此,在社交网络中应用数据挖掘技术具有明显的优势及作用,具有较高价值。
2.2社交网络中图数据挖掘研究方法
对于社交网络这一较大数据图而言,在实行图数据挖掘过程中,可对图数据挖掘中挖掘方法进行应用。在实际实施数据挖掘中,所选择运用算法全部运用图数据挖掘中全部算法,对于这一结合而言,其具体实现过程包括以下内容:其一,将社交网络中相关数据集获取;其二,对社交网络中相关数据实行预处理,其内容主要包括数据清理、数据集成及变化,还有数据规约;其三,选择适当特征;其四,选择数据挖掘中适当算法;其五,实行图数据挖掘;其六,对挖掘结果进行解释及评估;其七,对所发现相关规则及模式进行利用。在社交网络实际应用过程中,对于不同应用场景,图数据挖掘技术也表现出不同应用模式,因而在图数据挖掘实际应用过程中,相关技术人员应当对实际应用场景进行清除认识及分析,依据实际具体场景对图数据挖掘进行合理选择,从而保证图数据挖掘能够更好符合实际需求,使其得以更好应用。
2.3在社交网络中图数据挖掘的应用发展
在当前社交网络中,为能够使图数据挖掘得以更好应用,应当促使其实现更好发展,保证其能够发挥出更大的作用。为能够使其得以更好应用,应当对图数据挖掘进一步加深研究,研发具有更高水平的图数据挖掘技术及方法,从而使图数据挖掘技术应用范围得以扩展,使其在社交网络中能够得到更加理想的应用。另外,对于图数据挖掘技术人员而言,应当不断激进型学习及研究,提升自身水平及能力,在此基础上才能够对图数据挖掘技术进行更好应用,确保图数据挖掘技术在实际应用过程中得以更好发挥。此外,在图数据挖掘技术应用中,还应当注意结合当前时代发展趋势,保证图数据挖掘技术应用能够更加符合时代发展特点,从而使社交网络实际需求能够得到较好满足,实现更理想发展[3-4]。
3 结语
随着当前数据挖掘技术不断发展,图数据挖掘技术也得以较好发展,并且在很多方面均得到十分广泛的应用,而在社交网络中的应用就是比较重要的一个方面,有利于社交网络更好发展。因此,为能够使社交网络更好满足社会各方面需求,相关人员需要对图数据挖掘应用加强认识,并且促使图数据挖掘在社交网络中实现更好应用,为社交网络的进一步发展提供较好的技术支持。
参考文献:
[1] 崔景洋.图数据挖掘研究[J].太原师范学院学报(自然科学版),2018,17(01):38-40+46.
[2] 张素智,张琳,曲旭凯.图数据挖掘技术的现状与挑战[J].现代计算机(专业版),2015(26):52-57.
[3] 李桃陶,周斌,王忠振.基于社交网络的图数据挖掘应用研究[J].计算机技术与发展,2014,24(10):6-11
[4] 丁悅,张阳,李战怀,王勇.图数据挖掘技术的研究与进展[J].计算机应用,2012,32(01):182-190.
【通联编辑:光文玲】