宾扬帆
(湖南环境生物职业技术学院,湖南 衡阳 421005)
创新创业是当今社会的主旋律,但在过程中存在激烈的竞争,需要面对若干不确定因素,导致创新创业的成功率偏低。高校作为人才培养的基地,有责任在创新创业中给予专业的指导和建设性的路径建议。现实中,由于信息不对等、不及时等原因,高校的创业路径指导存在滞后和盲目的问题。为了从技术层面解决这一问题,应用大数据分析的思维,将影响创新创业的因素以数值化的形式表示,并将其影响效果和相互关联关系在模型中进行诠释,所得到的结果是兼顾了历史、同行、背景、产业相关方等丰富数据的融合体现,会对创新创业的方向和路径起到指引作用,避免了盲目跟从所带来的风险。同时,通过数据融合分析的全面性特点,可以在纷繁复杂的市场关系中,找到适合创业者专业方向的路径,助力创业成功。在大数据处理技术领域,“融合”已经是一种重要的理念,可以将纷繁复杂的多元信息进行归一化处理,建立可相互影响的信息处理模型,以实现复杂问题的简单化描述。多源信息的融合有助于挖掘数据的潜力,提高分析的效率;多源数据的相互验证,可以减少错误和疏忽,防止决策失误。
制约创新创业成功的因素很多,但是在某一确定行业领域,单一影响因素的作用效果却是可以预先评估的。因此需要在很多因素的海量信息中,提取出对创新创业的结果影响最直接、作用最突出的一项或几项数据信息,作为评价该创业创新路径成功概率的核心要素。
数据筛选规则针对的是某一确定行业的相关单位经营业绩、发展速度、产业规模、用工层次、营收额度、纳税信息等庞杂的数据信息,采用关键词过滤的监控方式和特定类型数据的对比鉴别,收集到关联度高的价值数据,实现数据挖掘。设计的具体流程为:SDFR(Service discovery for multi-robot systems,多自动处理系统的服务发现)通过网络层传输到应用层的整体数据特性,对数据的特征、总量等关键信息进行统计类型的描述。SDFR系统具有良好的可扩充能力,能够根据行为的特征,实现对各种关键词的处理,包括采样输出、原始报文和源资料输出等。借助SDFR系统核心引擎,以信息融合技术为基础的大学创新创业路径规则体系主要由规则头部、规则本体和规则行为三大类组成。规则主体定义特征匹配、计算规则,以提高规则的易读度。在SDFR系统的搜索引擎发现关键词后,认为该段信息具有价值,则开启扩展搜索,对该信息段的关联信息和上下游信息进行加强检索。过程引擎是多维数据融合过滤过程的核心,可以将SDFR转化为一组过滤法则,根据需求启动对应的数据处理,最终实现一个完整的过滤过程。整个处理流程由规则预处理、规则匹配和规则发现标识3个环节组成。该文对所选择的测值资料采用平均权重法进行分析,其核心是一种特殊的最小二乘估算,如公式(1)所示。
参数的最小二乘估计如公式(2)所示。
图1 信息数据融合示意图
式中:观测矢量∈R,观测矩阵∈R,未知参数矢量∈R,∈R为相同分布高斯白噪声。当观测矩阵=[1,1,...,1]∈R,化简为式(3)。
对矩阵进行分析,发现该算法与平均法基本一致,验证了模型的正确性。通过相似的计算程序可以把这种方法称为最小无偏化计算。该文应用了一种基于最小二乘的最大值估计法,即最大偏差二乘法可以对下限进行最大程度的估算。在该条件下,算法的最大值会受到限制,应用基于数据融合的线性偏差估算方法,可以有效地改善筛选的可靠性.
对规则进行分析,进行优化匹配。利用SDFR语法分析和词法分析,规范了搜索结果的匹配性;从多维的数据集中,提取各个规则下的不同维度数据,按照不同的维度划分,构建起一个多维的规则,并以此为基础构建了多维数据模型,以实现基于Bitmap数据下标的快速查找。当Bitmap发现满足条件的矢量结果,建立链接,并设定标志位bit为1,代表相应的常点数;如果bit为0,则代表在匹配处理中匹配结果发生了变化。基于数据包、报文和深度报文的多维度特征比对,采用基于数据流的规则匹配。网络信息的特征包括自定义标题、五元组和载体的信息特征和相位特征,包括会话创建、会话重组和会话超时。在对话流程建立的过程中,可以对五个元素组进行分析,判断自定义特征。然后进行五个元素相应维度的对应匹配,并刷新对应的结果矢量;对重新组合的过程不必进行任何的匹配;在保证精确度的前提下,对多个层次进行多维的匹配,提高数据处理的正确性。引入线性模型的典型形式,为式(4)。
未知矢量的最小二乘估计为式(5)。
式中:Λ={λ},为特征根,为线性变换。α和x之间的关系如式(6)所示。
式中:是对应特征根的标准化正交特征向量,通过对多个单维度Bitmap的结果矢量进行对比和操作,并从该结果矢量的中间点找到相应的规则ID,从而得到该规则的真实ID。规则矩阵是以多个单一维度的法则矢量为基础,以发现的结果为参数,储存该规则的集合。该算法采用了基于2个方向的矩阵模型实现对网络数据的相似性模拟,并将其划分成行和列两种类型变化。
以数据整合为基础的大学创新创业路径引导信息的整合,要求在对创业成功性进行判定时,通过对确定行业各种特征指数的分析,结合输入的确定信息,进行全面剖析,得出对创业成功率的最后判定。通过对各个目标的不同特性描述,对这些信息进行分析和加工,根据一定的规律对冗余和互补信息进行综合,并对其进行选择和判定,从而得出一个正确的决策结果。
创业融合路径指导利用冗余度的方法对目标进行分析,并利用补充的数据增强了系统的稳定性。对这些数据,系统并没有进行简单的分析和整合,而是按照数据中的时空特性,按照数据的等级进行分类,以此实现在一个层面对数据进行分析,也可以从多个层面进行融合。分类过程分为数据层、特征层和决策层3个层级。该文根据以上原理,对有偏差量的可靠度进行了量化表达,在较大程度上反映了被测参量的真实值。在该情况下未知数矢量的每个元素α的有偏样本方差为式(7)。
因为α 满足正态分布,所以高校大学生对创新创业的路径指导α的概率密度函数为式(8)。
在对数据进行分析和合并之前,通过对传感器的测量结果进行预处理,以消除噪声的影响,从而获得准确的数据。数据的特征抽取是在经过预处理后,按照特定的准则选择出相应的特征,从而获得最终的融合结果。最后通过数据的融合运算,针对特定的应用需求进行选择和运用
[10]。
通过对各信息进行有效的数据层次融合,完成对目标的最终判断,从而改善整个创业路径的综合效能。由于数据具有多种特性,因此可以按照不同的应用需求和数据特性对其进行多层次、多阶段的分析,从而进行分级。因为在提取原始数据和资料时,必须先概括与原资料完全一致的特征信息,否则无法将2种类型的资料进行合并。概括过程不需要预先进行任何的处理步骤,即可将数据的全部信息保留下来,从而实现数据的融合。利用相关对象的特征矢量进行目标环境的辨识,使用神经网络算法,决策级集成了各个感知系统的决策信息,从而提高了性能。在决策层面上,各个感知节点分别接收到各自的数据,并对各个独立的个体进行分析判断,在图2中显示了特征级的数据融合层次构造图。
图2 数据融合层次图
针对高校的创新创业背景下,在进行融合的过程中,要从融合方案、资金预算、检测参数以及系统性能等方面进行考量,融合效果与融合层次、融合程度和计算能力都息息相关。所得到的最终决策,综合了制约创业成功的影响因素,在多重决策的前提下,实现了相互关联,剔除重复影响因素,加重了关键影响因素,形成综合化决策结果。
为了更好地理解大学生创新创业的意识趋向,该文从基本情况、创新计划、创业方向和创业预备四个方面入手,将研究对象涵盖到全体应届毕业生。大学生创业目标不够明确,但在创业者看来,创业最大的问题在于缺少经验、缺少人脉、缺少社会资源、缺少创业精神等。研究结果表明,目前高校学生创新创业存在突出问题变现在:高校创新创业课程开设不足、创业政策和理念认识不足;在应试教育体系中,营销意识、理财技能和交流技能基本欠缺;项目选择盲目,好高骛远,创业技能不足且急于求成;社会资源相对贫乏、人脉积累不足;经营管理经验不足,处于“摸着石头过河”的盲动状态;国家和社会层面在政策倾斜、资金支持等多个方面相对欠缺;对现有社会资源、平台无法合理利用等可能遇到的问题或潜在风险。将以上直接或潜在影响因素作为输入数据,进行数据信息的融合计算,验证高校创新创业路径指导的作用与正确性。
为更好地对比研究大学创新创业过程中的有偏差和无偏差的测量结果的可信度,结合一个统一的基础标准,在非偏差的对称范围中,对有偏差的可靠度进行量化表达,数据融合的过程如图3所示。
图3 数据融合过程
由于测量的可靠性和误差都是在(+∞,+∞)的范围之内,因此,量化表达的可靠性必须在一个特定的数值区间中进行量化评估。例如假定在一个限制条件下,测量的数值在(+∞,+∞)的区间中均可以达到,所以任何一个测量的数值都是绝对可靠的,明显不适合于实际情况。在测量的过程中,要力求一个尽可能小的变化范围和一个可接受的误差区间,测量的可靠性必须是高可信度。因此,不能仅依靠一个方差或一个误差来度量,而是要把误差和方差结合起来。可靠性指数不仅要量化,而且还要给出上限,二者缺一不可,如果只量化可靠性而不给出上限条件,就不可能准确地判断其可靠性。将基本情况、创新计划、创业方向、创业准备四个维度的不同情况数据代入模型中计算,融合判定结果对例如图4所示。
从图4可以看出,创业目标明确的创业大学生越来越多,该模型可以在不确定的情况下,将数据的统计结果与最小二乘法进行比较,制定一种新的路径指导策略。采用该方法能够提高指导的可靠性,为创业学生提供有针对性的建议,使高校学生创新创业的内容明确,提高创业成功率。
图4 高校大学生创新创业指导后变化图
当前,我国高校学生在创业的过程中,对创业的性质、创业目标的选择、创业方向的选择、素质的培养、可能遇到的问题以及失败后的对策等都存在较大的误区,亟需给予专业性的指导。在数据融合技术的基础上,利用数据分析技术,将实测数据的平均值或权重平均与最小二乘法进行了等值,并根据有偏差估算的方差和结果调整测量准确率,并给出了一种具有偏差的数据融合算法,可以全面的处理制约学生创新创业的影响因素,形成综合化的指导意见,供学生参考。通过这种数学化的创新创业路径指导模型,在总结前人经验的基础上规避创新创业风险,为学生提供一种融合多方数据信息的指导意见,助力创新创业成功。由于时间的问题,制约创新创业的影响因素信息等基础数据库构建的还不完善,导致计算过程存在较大的偏差,需要在今后的研究中不断补充丰富,在迭代提升中提高路径指导的准确性。