张 峰
(1.中国航天系统科学与工程研究院, 北京 100048;2.山东省低碳经济技术研究院,山东 淄博 255012)
数据系统工程:系统优化的决策支持技术
张峰1,2
(1.中国航天系统科学与工程研究院, 北京 100048;2.山东省低碳经济技术研究院,山东 淄博 255012)
摘要:大数据背景下,数据的决策支持作用愈发显著。本文在分析系统内涵的基础上,提出了数据系统的概念,即由数据采集系统、数据传输系统、数据处理系统和数据应用系统等组成复杂统一体。通过将系统工程理论与方法引入到解决数据系统开发与利用,进一步定义了数据系统工程,同时明确了数据系统工程研究对象为数据系统,其呈现集成性、关联性、结构性、涌现性和大系统性等特点。数据系统工程的研究内容主要包括数据系统规律探索、数据系统开发利用、数据系统协调控制等。此外,初步明晰了数据系统工程的方法论,并分别从时间维、逻辑维、知识维,以及“物理、事理、人理”的角度,对其进行了探讨分析。为推动数据处理与系统工程等学科发展提供参考借鉴。
关键词:数据系统;系统工程;数据系统工程;决策支持
互联网技术的发展与应用使人类行为的网络交互性日趋显著,数据由此也如雨后春笋,在数量、种类和形态上均呈“爆发式”增长,数据正像石油、钢铁一样日益成为重要原材料,以数据为重要驱动力的数据革命随之而来[1]。特别是现阶段愈演愈热的“大数据”,促使人们的思维方式、行为方式、决策方式、商业模式、产业模式和管理模式等都面临一场颠覆性变革[2]。此背景下,实现对数据的多维识别及管理成为当前亟待解决的问题。本文通过分析数据系统工程的内涵特征及其对水资源系统优化的决策支持作用,阐明数据系统工程必将是数据科学的重要组成部分。随着数据科学的发展和系统工程在数据科学领域的研究深入,将逐渐发展成为一门独立的学科体系。
系统是由两个或两个以上相互联系、相互依赖、相互制约、相互作用的事物和过程组成的集合体,并具有特定的功能[3]。系统所包括的各项要素按照一定方式实现各物质、信息与能量的交换(包括输入、传输、存储、转换、输出等),而不同要素之间有其内部的演化规律,以适应外部环境的变动[4]。通常构成系统的要素复杂而多样,特别是针对以人为主体(存在思维)的系统分析,复杂系统理论等系统工程理论与方法呈现了其独特的作用。
数据系统是指在一定的时空与区域范围内,可实现载体经济价值的提升,为人类社会活动提供决策支持的数据因素与条件的复杂统一体。复杂统一体中不同类型的数据相互关联、相互作用,尤其是时间序列下呈现其内部独有的发展规律,其终极目的是对人类社会提供有效的服务。复杂统一体与外部环境(或其它系统)进行信息交换①通常系统与外部环境之间需要进行物质、能量、信息的交换,而数据系统与外部环境之间主要以信息交换为主。,其同构数据及异构数据之间的相互作用具备复杂系统的诸多特征,一般数据系统由数据采集系统、数据传输系统、数据处理系统和数据应用系统等组成,不同子系统之间相互依存,是多目标、多变量、多属性和决策依赖度强的复杂巨系统,而其不同子系统又是由多个异构层级构成的子系统组成[5]。例如数据处理系统是由一系列子系统构成,包括数据的完备性构建系统②数据的完备性指既有数据统计量(数据缺失状况)及其准确度。、数据的真伪性鉴定系统③数据的真伪性指由于数据源种类繁多、数据量大、监测难度高等,而不同部门的统计口径、方法和范围不一致,导致同指标数据在相异部门之间存在较大差异,同时诸多以“上报”形式取得的数据的真实性亦有待核查。、数据的功效性提升系统④数据的功效性指多元、异构的海量数据通常存在冗余和数据关联系被分割的情况,导致数据应用效率低,提供决策信息有限,难以发挥数据的功能和价值。等,各个子系统之间相互联系、相互支撑。因此,研究数据系统应从数据的全流程研究,用系统的观点和方法解决数据问题。
钱学森等将系统工程定位为组织管理“系统”规划、研究、设计、制造、试验和使用的科学方法,是一种对所有“系统”都具有普遍意义的科学方法。从我国系统工程的发展历程来看,它是一门从整体的角度出发,对提升系统运行质量而必须具备的全部理论、方法、技术的综合性工程技术,其按照系统优化的目标要求,将系统科学、控制科学、信息科学和应用数学等理论工具进行有效协调,采取定性与定量相结合的综合集成方法,研究解决系统优化的分析、设计、控制和管理等问题,最终实现系统的综合提升[6]。
通过将系统工程理论与方法引入到解决数据系统开发与利用则称为数据系统工程。即数据系统工程是以数据系统为研究对象,通过跨学科、跨领域的知识技能实现数据系统综合提升所要进行科学设计、合理开发、运行管控的理论、方法与技术的统称。它综合运用系统思维、数学方法、建模理论、优化评价以及各种技术,对数据系统的数据采集、传输、存储、处理、应用和反馈等功能实现系统设计与优化配置,为最大化的发挥数据的决策支持效用提供科学有效地工程技术保障[7]。
1.研究对象及其特点
数据系统工程研究对象为数据系统。后者的基本特点如下:①集成性:具备多属性的数据要素不仅要在类别上存在较大差异,在构成数据系统的要素数量也必须形成系统集合;②关联性:构成数据系统的多子系统之间以及子系统所包括的数据要素之间存在相互关联、相互影响的内部关系。如非间断数据传输系统受到外部环境的影响导致传输数据的缺失、变动,则易导致数据处理系统中缺乏科学有效的依据;③结构性:现阶段虽还未实现数据系统结构的清晰化辨识,但由于数据必须依附于载体存在,而不同的载体通常具备特定的层次结构,数据随之形成特有的复合结构,并在一定的承受阈值之内维持在平衡状态。当数据系统外部干扰力超越其阈值,则其结构易被破坏,导致原有功能的紊乱或消失;④涌现性:此特性是指依附于不同载体的数据具有其自身的内部规律,尤其是时间序列下的数据按照其分析目标、分析方法的不同通常呈现不同的特点,而当相异载体的数据进行关联性分析时,亦可探寻出单一载体数据所无法呈现的规律特点。⑤大系统性:此特点与数据系统如社会经济系统、资源系统等相似,尤其是在大数据愈演愈烈的情况下,数据规模庞大,内部结构复杂,其相异载体的数据之间更是关系错综多样,其随机性显著,是一个复杂的大系统。
2.研究内容
数据系统工程以数据系统为主要研究对象,主要研究内容包括:
一是数据系统规律的探索。数据系统规律探索的目的是实现系统的客观认识,更加科学、有效地辨识系统的基本特性与运行规律,为合理调控系统要素与处理数据要素关系提供决策支持。数据系统规律的探索主要包括3个层面:首先,要对构成数据系统的数据要素进行统筹分析,重点透析数据的采集、传输、存储、加工、属性、分类、功能;其次,探析数据系统要素之间的动态关系,如数据要素之间的信息传递、作用机制等,探索中应有效地辨识数据要素客观存在的内部关系,也应将人为因素纳入到考虑范畴;再次,对数据系统的整体演变机理及属性规律进行研究,尤其是数据系统与外部环境之间、数据系统与其载体之间的关系[8]。
二是数据系统开发利用的研究。主要包括需求研究、数据采集传输、数据集成和数据利用研究。数据系统需求研究,包括需求种类、性质、数量、时间、空间等研究[9]。数据的采集与传输研究,应注重其采集效率的提升,当前越来越多的数据采集技术都集成于操作系统之上,如借助卫星高分辨率图片得到观测数据系统,有的借助高频数据实现窄带条件下无损、实时数据采集,均提高其采集的效率和准确度。数据集成方面,这是实现数据质量提升与满足支持决策要求之间的重要环节,目前研究的焦点是如何将本体⑤本体是由若干概念及其在某种逻辑理论(如一阶谓词演算)支持下的定义所构成的一种分类法。对于特定一个领域而言,本体表达的是其整套术语、实体、对象、类、属性及其之间的关系,提供的是形式化的定义和公理,用来约束对于这些术语的解释。本体允许使用一系列丰富的结构关系和非结构关系,如泛化、继承、聚合和实例化,并且可以为软件应用程序提供精确的领域模型。例如,本体可以为传统软件提供面向对象型系统的对象模式(object schema),以及类的定义。视为一种工具引入到数据集成系统,通过发挥本体所具有的语义描述方面的优势,解决其语义异构的难题。数据利用研究,既要解决集成数据的本身存在的问题,又要在此基础上发挥数据的功效性。前者包括对缺失数据的完备性再造(如快速准确填充缺失的高维数据问题)、数据的真伪性辨识(如在线监测中存在的“一数多来源”问题)等,需要对数据挖掘、数据融合等技术进行更深层次的探索;后者要分析与数据开发利用相关的多方面要素、系统之间的动态关系,明确其带来的重要价值,亦要重视其负面效应,配套其相应的管理机制。
三是数据系统协调控制的研究。此处“控制”是指通过施加于数据系统(或其子系统)特定的作用力,实现系统(或子系统)功能与其状态相符合,进而满足实现系统既定目标的要求。数据系统协调是指解决(缓解)数据由采集到利用过程中所出现的冲突、矛盾,追求数据系统提升的最优化。当系统提升状态是非目标状态时,则需要对系统要素(子系统)进行重复调整,以满足要求。因此,该方面的研究更多的是侧重于解决数据系统优化过程中的管理问题。此外,该过程需要注意的是不同的数据系统所具有的系统特性相异,建立系统协调控制机制时不仅要注重其普适性,也要结合数据系统的实际情况做出针对性调整,并尽可能做到事前控制,避免其协调控制呈现“事后反馈”状态。当事后发现系统存在较大问题时,易造成控制成本的上升,甚至严重影响决策的正确性,导致无法估量的损失。
根据上述研究内容,可绘制数据系统工程所研究的基本逻辑层次,主要依次包括“数据采集层、数据传输层、数据基础层、数据集成层、数据处理层和数据应用层”6大层次,各层次均是数据系统工程的重要研究环节,具体见图1所示。
图1 数据系统工程研究内容基本范畴
系统工程方法论是数据系统工程发展的基本前提,包括传统的霍尔三维结构模型[10]、切克兰德软系统工程方法论[11],以及钱学森提出的从定性到定量的综合集成系统方法论[12]、顾基发等创建的物理-事理-人理(Wuli-Shili-Renli,WSR)系统方法论[13]等,可将其用于指导数据系统工程的研究。
霍尔三维结构主要涵盖时间维、逻辑维、知识维。其中,时间维主要包括系统工程由最初的规划阶段至后期的更新阶段所必须遵循的七大基本程序⑥时间维主要包括规划阶段、拟定方案、研制阶段、生产阶段、安装阶段、运行阶段、更新阶段等,但此为普适性阶段,具体阶段需要根据需求进行增减调整。,而在实际的复杂巨系统中,这其中的每个阶段又是非常复杂的过程;而逻辑维划分了更加精细化的步骤⑦逻辑维主要包括问题的摆明、待研究系统的指标(要素)设定、系统的合理构建(综合)、系统的科学分析、系统的优化、决策的制定及实施等,具体步骤亦需要根据研究需求进行相关调整。,明确了针对时间维上的各个阶段中的特点所应遵循的相关逻辑先后顺序;知识维阐释了为确保各个阶段、步骤顺利展开所应用到的全部知识、技术等。通过将时间划分阶段以及逻辑实施步骤进行相应的集成与综合,则建立了三维结构中的系统工程活动矩阵,用于系统的分析、设计、优化等。霍尔三维结构模型如图2所示。
图2 霍尔三维结构
相比霍尔三维结构,切克兰德软系统工程方法论在研究社会经济问题等方面更加强调比较学习,其方法论的内容主要包括了认识问题、根底定义、构建概念模型、比较与探寻、分析选择、设计实施、评估反馈等[14]。其中,根底定义主要是指整合系统问题的各项关键要素,并透析与之相关联的要素情况,在此基础上确立出可供参考的基本观点;比较与探寻主要是将所构建的概念模型与现实情况进行对比研究,探寻可以满足决策者需求的最佳方案;评估反馈则是根据具体实施过程中所呈现的新问题、新认知,对初始问题及概念模型等进行及时的反馈修正,见图3。
图3 切克兰德方法论
综合集成方法要求充分发挥专家体系的智慧经验,强调将其体系与机器相协调合作。即可划分为三个主要步骤:实现定性综合集成、实现定性定量相结合综合集成、实现从定性到定量综合集成[15]。此过程的各阶段并非是按照还原论的思想进行划分,而是逐次逼近。在实际问题中,涉及到复杂巨系统的难题一般都具有非结构化问题,其中存在较多的难题是利用计算机所无法攻克的,因此,利用综合集成方法可解决非结构化问题的逼近处理问题,具体过程见图4所示。
WSR系统方法论主要涉及到“物理”、“事理”、“人理”3个方面,并由此印证了系统实践活动的相互关系。其中,“物理”主要是指物质在具体运动过程中所涉及到的机理,不仅涵盖了狭义物理,也有地理、化学、天文和生物等。采用自然科学科学知识的相关理论用以阐释“物”具体指什么。
“事理”表示做事的道理。该方面主要是探索怎么去调用物料、人员、设备等。所采用的方法有管理科学、运筹学等多方面知识,重点解决“如何去做”。它是对特定系统的构建及模型的选择做出最佳的决策,实现系统的优化提升与管理,从而对系统资源配置及环境进行改善,实际运行过程中也会受到人的经验、知识、偏好等主观因素影响,其终极目标是构建出客观有效的物理模型[16]。
图4 综合集成方法用于决策支持问题
“人理”表示做人的道理。所涉及的知识领域主要包括人文社会科学,对系统运行过程中人为主观关系进行分析,用以解决“应如何做”和“最好如何做”。人作为系统参与者具有高度的复杂性,所形成的实践活动也是复杂多样。因此,系统运行也必须重视此因素的作用。
表1 物理、事理、人理系统方法论内容
根据上述系统工程方法论,可知系统工程方法论不仅吸收了还原论与整体论的优点,还弥补了其各自的短板。而本文所提出的数据系统工程方法论正是借鉴上述系统工程方法论的优点,既强调专家体系、数据信息体系、知识体系、计算机体系的综合集成与有机融合,也注重不同维度下的数据系统工程各时间阶段所遵循的逻辑步骤。即数据系统工程方法论是以硬系统方法论与软系统方法论⑧硬系统方法论主要包括运筹学方法(OR)、系统工程方法论(SE)、系统分析方法论(SA)、系统动力学(SD)等,软系统方法论主要包括切克兰德软系统方法论(SSM)、定性系统动力学(QSD)、社会技术系统设计(STSD)、关键系统干预法(TSI)等。为基础,结合综合集成方法论与WSR系统论,构建以时间维、逻辑维、知识维三大维度为基础的数据系统工程三维结构(见图5所示),明确各维度的分析和解决数据问题辩证程序,辨识数据系统工程在目标需求导向下的物理、事理与人理内容,从而在大数据愈演愈烈的情况下,更好地为人们处理数据系统工程问题提供思想、方法和准则等方面的科学指导。
图5 数据系统工程三维结构
1.数据系统工程时间维
时间维是指数据系统工程的研究阶段与进程。数据系统工程在宏观层面上主要分为数据系统规划设计阶段、数据系统论证阶段、数据系统分析阶段、数据系统开发利用阶段、数据系统优化配置阶段等,各阶段有效协调形成一个完整的统一体。其中,数据的采集、传输、处理、存储与利用等环节必须按照系统规划、全面调研、初案拟定、方案优选、方案实施、实施反馈的流程进行系统组织与科学管理[17]。
2.数据系统工程逻辑维
数据由采集到利用的过程是按照“挖掘问题-系统构建-系统分析-模型构建-优化提升-决策制定-工程实施-反馈协调”基本解决问题思路[18]。其中,“挖掘问题”指面向决策支持需求所需要解决的数据问题及其条件分析,要求信息资料调研充足、现状分析彻底与变化态势明确等。“系统构建”指按照规划目标统筹各项数据关联要素,并按照目标系统状态要求构建相应的数据系统及其评价指标体系。“模型构建”是指按照所构建的数据系统的特点,选取与之相契合的系统工程决策理论与方法,并针对系统优化提出多种可供选择的方案,进而利用特定模型⑨具有评价分析功能的模型有多种,包括概念模型、图式模型、逻辑模型、物理模型数学模型等,模型的确定要根据评价需求进行针对性选择。对这些优化方案进行优劣排序与择优选取。其中,数据系统优化方案的对比主要是按照“最终目标-基本准则-具体指标-备选方案”的逻辑顺序进行“四定”(定性、定量、定时、定位)分析,涉及到目标评估、结构探索、功能界定、价值透析等方面内容。该过程不仅有效结合了系统的定量分析,也发挥了专家经验的重要作用。“优化提升”主要是对数据系统优化方案所涉及到的参数、指数与系数进行反复论证,最终确定最佳的可实施性方案,并为“决策制定”与“工程实施”提供有效保障。“反馈协调”则要求对数据系统优化方案实施过程进行动态监测,并及时总结,就其中暴漏出的问题对原方案进行针对性的调整改善。
3.数据系统工程知识维
实施数据系统工程要求决策者拥有数据处理、信号科学、经济数学、管理科学、系统科学与系统哲学等跨学科、跨领域的集成知识体系。而根据目标需求的不同选取或建立科学有效的技术方法体系则成为数据系统工程取得成效的关键。因此,以目标导向为前提的数据系统工程的实际实施过程中,不仅要注重“硬件”⑩包括新技术、新方法、新工艺、新流程、新设备等。的使用,也要充分发挥“软件”⑪如将系统科学、系统工程理论与方法技术有效运用到数据融合、数据挖掘、决策分析、组织管理等相关方面等。的功效,即注重软硬件技术的集成,将其与现代化科学技术手段相结合,充分发挥多种理论与技术手段的协同效应。尤其是在解决诸多特定的问题时,通过对软硬件技术手段的组合优化,能够发挥单一技术手段所无法取得的成效。
数据系统工程方法论可为处理数据系统问题提供科学的指导,而数据系统工程技术方法的选择需要根据具体实际问题的需求进行选择。考虑到当前数据逐步呈现出海量、多元、异构等多种特性,本文在此仅以可用于分析系统稳定性影响因素的多元数据分析方法PLS(Partial Least-Squares)为例,对数据系统工程技术挖掘多元数据特征成分的一般建模过程进行介绍(其计算过程可利用MATLAB等计算机软件进行编程实现)。PSL多元数据分析法由S.Wold和C.Albano等人首次提出,该方法在一定程度上可被认为是在主成分(PCR)方法上的加强与改进,PLS在成分提取的过程中同时考虑数据自变量(解释变量)和数据因变量(被解释变量)的信息,在多变量的复杂数据系统中,PLS利用数据信息分解的思路,将自变量系统中的数据信息重新组合,有效地提取对数据系统解释性最强的综合变量,排除重叠信息或无解释意义信息的干扰,从而克服多重共线性在数据系统建模中的不良作用,得到更为可靠的数据分析结果[19]。其建模步骤如下:
Step1:数据要素标准化处理。设已知数据因变量Y和p个数据自变量X1, X2,…, XK,数据要素样本数为n,形成数据自变量矩阵X=[x1, x2…,xK]n×p和因变量矩阵Y=[y]n×1。为了减少运算误差,将X和Y进行标准化处理,得到标准化的数据自变量矩阵M0和N0因变量矩阵,具体方法见公式(1)。
式(1)中,Xij表示数据自变量X中第j个数据变量的第i个数据要素样本值;表示数据自变量X中第j个数据变量Xj的平均值;Sj表示xj的标准差;yi指因变量y的第i个数据要素样本值;指y的平均值;sy表示y的标准差;分别表示自变量和因变量标准化后的数值。
Step 2:从中抽取一个数据因素成分,t1=M0W1,其中,分别做M0、N0关于t1的普通线性回归。其中回归系数,称M1、N1为数据残差矩阵。
Step3:以M1、N1取代M0、N0,可进行第二个PLS多元数据主成分t2的提取。按照精度要求,提取了k的PLS多元数据主成分:t1,…,tk,实施Nk在t1,…,tk上回归,可以得Nk=r1t1+…+rktk。由于t1,…,tk都是M0的线性组合。因此,Nk可写成M0的线性组合形式,即:Nk=r1M0W*1+…+rkM0W*k,其中,,I为单位阵。最后,有,x*的回归系数为式中w*kj是W*k的第j个分量。按照标准化逆过程可将的回归方程还原为y对x的回归方程。
Step4:交叉有效性分析。为了寻求恰当的多元数据主成分成分个数m,在此采用交差有效性系数Q2m对其确定化处理,当提取多元数据主成分满足终止条件,则转下一步,否则,另M0=Nm,N0=Nm回到Step2继续运行。定义tm的交叉有效性Q2m为:
其中,交叉有效性Q2m反映了成分t1,…,tm对数值y的预测能力,。yi是原始数据中第i个样本点因变量的取值。表示用m-1个成分拟合的回归方程中的i点数据预测值,表示去掉第i个数据样本点后用m个主成分拟合方程在i点的预测值。当Q2m<0.0975时,认为tm成分的贡献不明显,无法提高数值预测精度,计算可以终止,则可以确定多元数据主成分的阶数为m。
Step5:按标准化的逆过程,将M0的分析方程还原为Y对X的数据分析方程,即为PLS多元数据分析模型:
其中,Y和Xj为经标准化处理后的数据变量,用以消除异常数据对于多元数据分析模型估计精度的影响。Y表示数据系统中某一总量型的指标数据,X表示影响总量指标数据的因素变量,βi(i=1,2,…,10)为变量系数,ε为数据残差项。
上述的PLS多元数据分析与建模过程正是基于系统工程方法论,利用数据系统工程技术对数据进行处理与应用的典型案例之一,其具体实施的过程可选取“物理、事理、人理”的角度对实际问题进行针对性的探讨与分析。其中,时间维度上,PLS多元数据分析要从数据的产生处作为根本出发点,对数据的来源与传输存储等情况进行全面的调研分析,并取得建模所需要的数据,针对解决具体实际问题的要求(WSR方法论中“物理”与“事理”),选取相应的类别数据,利用PLS多元数据分析技术对所选数据进行上述建模分析过程,并取得相应的多种备选方案。逻辑维上,要注重对数据系统的全局性考虑(WSR方法论中“事理”与“人理”),利用PLS进行多元数据分析建模时要基于数据系统的最优化目标导向,而对于多种备选方案的选择,必须是按照定性与定量相结合的方式进行多指标评价与分析,不能单纯的依靠经验或仅仅依靠定量化的决策。选定方案并实施后,根据具体的实施效果探寻制约数据系统提升的问题点,并查找到关键瓶颈,依据此对PLS多元数据分析模型进行再优化处理,提升模型的精度、速率等。而在知识维上,PLS多元数据分析虽然形似以数学分析为主,但其过程融合了多种学科的交叉,特别是管理方法与决策、多元统计、计算机工程等方面的支撑尤为重要,而在解决不同的实际数据问题过程中,还需要将PLS多元数据分析技术与数据的特点相结合,并考虑数据载体的特性,综合集成相应的学科知识进行统筹分析,为最终决策提供科学有效地支撑。
数据系统工程是数据处理与系统工程高度结合的学科,属于数据科学的重要分支,旨在通过数据系统工程理论与技术挖掘数据的重大决策支持作用。当前国内针对数据科学的研究愈加深入,尤其是在大数据时代,利用已有的数据处理方法与系统工程技术,创新传统数据处理研究方法,站在数据科学的最前沿进行理论研究与实践探索,成为推动国内数据科学迈向国际先进之列的重要保障。
展望未来,数据系统工程研究趋势:将以数据有效利用与人类社会、自然生态协调发展研究为重点,数据生态、数据经济、数据管理为主攻方向的数据科学开发利用研究;由信息科学、数据科学、空间科学以及系统工程等跨学科融合模式产生的数据信息系统的研究;大数据概念与研究范畴不断深入,跨领域、跨体系的大数据系统整体性研究;在数据流动视角下的数据高效采集与传输效率研究;从静态分析转为动态评估,从初级评析走向注重数据经济研究;数据系统研究由常规方式转为与高新技术结合,探索方法与技术更具现代化特色。这些将推动数据系统科学发展迈向新高度,为决策支持提供基础保证。
参考文献
[1]张东霞,苗新,刘丽平,等.智能电网大数据技术发展研究[J].中国电机工程学报,2015,35(1):2-12.
[2]李学龙,龚海刚.大数据系统综述[J].中国科学:信息科学,2015,45(1):1-44.
[3]钱学森,许国志,王寿云.组织管理的技术——系统工程[J].上海理工大学学报,2011,33(6):520-525.
[4]钱学森.系统科学、思维科学与人体科学[J].自然杂志,1981,1(3):3-9.
[5]金澈清,钱卫宁,周敏奇,等.数据管理系统评测基准:从传统数据库到新兴大数据[J].计算机学报,2015, 38(1):18-34.
[6]戴汝为.系统科学及系统复杂性研究[J].系统仿真学报,2002,14(11):1411-1416.
[7]俞立平.大数据与大数据经济学[J].中国软科学,2013,(7):177-183.
[8]李金昌.大数据与统计新思维[J].统计研究, 2013,31(1):10-17.
[9]任磊,杜一,马帅,等.大数据可视分析综述[J].软件学报,2014,25(9):1909-1936.
[10]岳志勇,丁惠.基于霍尔三维结构的技术创新方法培训体系研究[J].科学管理研究,2013,31(2):20-26.
[11]闫旭晖,颜泽贤.切克兰德软系统方法论的诠释主义立场与认识论功能[J].自然辩证法研究,2012,28(12):29-35.
[12]王浣尘.综合集成系统开发的系统方法思考[J].系统工程理论方法应用,2002,11(1):1-7.
[13]顾基发,唐锡晋,朱正祥.物理-事理-人理系统方法论综述[J].交通运输系统工程与信息,2007,7(6):51-59.
[14]杨建梅.对软系统方法论的一点思考[J].系统工程理论与实践,1998,(8):91-95.
[15]于景元.钱学森系统科学思想和系统科学体系[J].科学决策,2014,(12):2-22.杜鹏.基于WSR理论的海洋战略性新兴虚拟产
[16]业集群成员间的信任机制研究[J].山东社会科学,2013,(1):98-99.
[17]潘平,郑辉,兰立山.大数据系统的本质特征及其哲学反思[J].系统科学学报,2015,23(3):26-29.
[18]郭华东,王力哲,陈方,等.科学大数据与数字地球[J].科学通报,2014,59(12):1047-1054.
[19]张峰,薛惠锋,董会忠.复杂巨系统理论视角下的甘肃省工业循环经济发展战略研究[J].工业经济论坛,2014,(4):146-156.
Data systems engineering: the decision support technology of system optimization
ZHANG Feng1,2
(1.China Academy of Aerospace System Scienti fi c and Engineering,Beijing 100048, China; 2.Shandong Academy of Low Carbon Economy & Technology Institute, Shandong Zibo 255012, China)
Abstract:The decision support function of data is more and more signi fi cant under the background of big data. The concept of the data system was proposed on the basis of the connotation of the system were analyzed in this paper, and it was composed of data acquisition system, data transmission system, data processing system and data application system, etc. Data systems engineering was de fi ned by introducing system engineering theory and method to solve the development and utilization of data system. In addition, the data system engineering research object was proposed, and it was data system. It presents many characteristics, such as integration, correlation, structural and emergent properties and large systemic etc. Data system law of exploration, development and utilization of data system, data system coordinated control is the main research content of engineering data system. Meanwhile, the data system engineering methodology was proposed, and it was discussed and studied from the temporal dimension, logic dimension, knowledge dimension. The proposed theories and viewpoints will help the subjects of data processing and system engineering to develop rapidly.
Key Words:data system; systems engineering; data system engineering; decision support
【作者简介】张峰(1989-),男,山东省济南市人,中国航天系统科学与工程研究院博士研究生,研究方向是制造系统工程。
【基金项目】国家自然科学基金项目(71371112);山东省自然科学基金项目(ZR2012GM020)。
DOI:10.11970/j.issn.2095-7866.2016.01.002
中图分类号:N945.2文献识别码:A
文章编号:2095-7866(2016)01-0017-12