钱宇锋
摘要:大数据技术是一种具有良好适用性得通用技术,其借助网络技术逐渐进入了现代人的生活中,因此现代社会也被称为大数据时代。在大数据时代背景下,网络环境发展迅速,但因为数据之间的逻辑关系十分复杂,且存在多层次的交互运维,使得人们对大数据的物理机制、关联规律等认知存在缺陷,相應难以开展相关的工作,因此说明对大数据时代多层复杂网络理论的网络科学进行研究,具有实践价值。
关键词:大数据技术;大数据时代;复杂网络理论
在大数据时代当中,人们对数据解析的深度、应用等有了新的需求,但在早期大数据技术应用当中,因为人们的认知程度不足,导致大数据技术应用效果并不理想,随之为了增加对大数据技术的掌握程度,研究学者们对其形成的复杂网络环境进行了研究,研究的目的在于了解大数据时代复杂网络环境中数据与数据之间的交互逻辑、大数据本质特征、生成机理等,以便构建大数据学习模型,提高大数据技术在现代社会中的实际应用价值。
1.大数据特征及其与复杂网络理论的关系
1.1大数据时代特征
大数据时代是在大数据技术普及背景下形成的一种时代发展趋势,各行各业都开始开始应用大数据技术,在应用方式上,首先围绕需求收集与相关的数据,形成一个数据集成体,其次针对数据集成体,对所有数据进行分类处理,再探寻数据与数据之间的逻辑关系,最终利用逻辑关系的发展演变方向,得到准确的应用方向。针对这一应用方式,在理论上是能够获得良好效果的,但实际来看,不少应用人员对于数据之间的关系理解并不全面,导致数据收集、数据逻辑关系探寻工作结果质量不佳,影响了最终应用方向判断的准确性,说明其对大数据技术的掌控能力不足,但造成数据之间关系理解问题得主要原因,就在于现代网络环境当中的复杂性[1]。
1.2大数据与复杂网络理论的关系
现代学者对于“复杂性”的研究从未停止,而大数据技术以及其形成得复杂网络具有很高的复杂性,对此自然被列入了复杂性研究的范畴当中,相应形成了复杂网络理论,说明两者之间存在关系。在现代相关研究理论当中普遍可以看到,绝大部分研究者认为要成熟、完整的对大数据技术进行应用、理解,都必须了解其中的复杂性,同时随着复杂性研究得深入,可以推动大数据技术发展[2]。
2.大数据时代下的复杂网络理论种类
结合上述分析可见,大数据时代下的网络环境与复杂网络理论直接存在紧密的联系,但在相关研究中,传统复杂网络理论并不能完整进行分析,且存在难以避免的缺陷,即在面对只有一种对象类型得条件下,其难以处理数据复杂性下产生的异构性特征,使得无法将数据相互联系,相应不能形成数据集成体,同时因为现代社会其他领域的不断发展,这种缺陷被持续放大,说明其无法应用于大数据技术分析当中。为了改善传统复杂网络理论的缺陷,有研究学者提出了“多层复杂网络理论”,这种理论建设与数据逻辑集成概念上,其核心观念为:所有数据之间都存在直接或者间接的逻辑关系,所以在这种理论条件下,可以包含大数据复杂网络环境当中的所有数据,并且可通过模型来确认数据对象与其他数据之间得关系。相比之下,多层复杂网络理论与传统复杂网络理论的信息丰富程度、容量要更高,可以支撑建模求解、分析预测等工作。
在本质上,多层复杂网络理论根据不同数据层之间的不同逻辑关系可以分为两个部分,即多层依赖网络、多层关联网络,其中多层依赖网络中数据与数据之间存在直接的依赖关系,即对任意一项数据进行控制,其他项会发生相同或近似的变化,说明两者之间得依赖性较强,但这些数据本身并不一定存在于同一载体当中;多层关联网络中数据与数据之间存在间接的依赖关系,但依赖程度并不高,即对其中任意一项数据进行控制,其他项并不会产生过多得变化,依旧可以在正常水平下进行运作,在载体上这些数据同样不一定存在于同一载体当中。
3.多层复杂网络理论下大数据分析重点问题
3.1数据节点中心性度量问题
在多层复杂网络理论下得到的大数据分析模型中,其框架内部存在很多个数据节点,这些数据节点的分布各不相同,且根据数据关联度问题,不同数据节点对其他节点会产生传播、博弈、控制等作用,且作用程度也存在差异,此时如果要对模型进行分析,就必须通过度量方法找到中心的数据节点,否则会导致分析工作无法开展,或最终结果准确度下降得问题。那么关于数据节点中心性度量问题得处理方法,在现代研究当中,一般采用扩展的方式来进行,即先选择任意一个节点分析其发展趋势,并进行演进模拟,之后可以得到该数据节点的演进路线,根据路线可以得到与该节点相关的数据节点类型、分布位置,此时根据这一结果可以判断选择的节点是否属于演进路线的终点或者起点,如果不属于两者中任意一项,则说明节点中心性可能较低,最终再对该节点进行操控,查看其对周边节点的影响,如果影响范围小,且影响程度低,则可以确认该节点不是中心节点,这一过程重复运行直至对所有数据节点测量完毕后,选择影响范围最大,且影响程度最高的数据节点为中心节点。
3.2动力学过程
结合上述数据节点中心性度量问题中提到的数据节点演进路线,不同类型的演进路线都具有独特的动力学过程,因此要准确对其进行分析,必须要了解这一过程。根据现代研究理论得知,多层复杂网络理论的大数据分析模型的动力学过程一般分为三类,即数据交互传播路线、数据竞争路线、数据动态性同步路线,其中数据交互传播路线主要根据实际需求,依照相应得逻辑关系来形成数据迁移,同时迁移方向为双向,所以相互之间存在交互关系,在这一路线当中,通常会存在两个数据中心节点,对双向数据交互进行发出与接收操作;数据竞争路线是指两组或更多的数据独立发展,但一旦两者之间出现了差异,那么另外一项数据节点就会相应下滑,同时与其相关的节点也会产生相应得影响,说明两者之间存在竞争关系,在这一过程当中存在两个以上的数据中心节点,但所有节点在绝大部分情况下属于同一类型,相互之间独立且存在间接影响;数据动态性同步路线是指两个或更多的数据节点共同发展,且当其中任意节点出现突破表现时,其他节点将出现相同变化,不同节点之间的数据传输方向为单向,在这一路线当中,同样存在两个以上的数据中心节点,但所有节点未必属于同一类型,相互之间联系密切存在直接关系。
3.3网络鲁棒性
网络鲁棒性是代表网络功能是否正常的关键因素,鲁棒性越低则说明网络功能越差,否则相反,因此在多层复杂网络理论的大数据分析模型当中,为了考究模型可行性或网络可行性,需要对其鲁棒性进行分析。结合相关理论得知,关于鲁棒性的分析方法,首先需要了解对网络鲁棒造成影响的因素,其次再分析当前分析对象中是否存在这些因素、因素的种类,如果存在则说明网络鲁棒性可能不完整,如果因素过多则说明鲁棒性可能受到了较大影响。
综上所述,本文主要对大数据时代多层复杂网络理论的网络科学进行了研究分析,通过分析得到结论:对大数据特征进行了分析,并将其与复杂网络理论特征相互对比,证实两者之间存在共同点,说明复杂网络理论可以应用户大数据时代的分析当中,且确认两者之间存在关系;结合现代研究,将多层复杂网络理论与传统复杂网络理论对比,证实多层复杂网络理论在大数据分析中更具适用性;对多层复杂网络理论下大数据分析中的三大重点问题进行了分析。
参考文献:
[1]先兴平,吴涛.大数据时代网络科学研究进展——多层复杂网络理论[J].产业与科技论坛,2016,15(19):80-81.
[2]张欣.多层复杂网络理论研究进展:概念、理论和数据[J].复杂系统与复杂性科学,2015,12(2):103-107.