杨利峰,王先超,李晓莹,刘浩然
数据的结构性和复杂性特征受到关注。大数据必然带来数据复杂性的快速增长,通常认为大数据具有低价值密度,大数据的价值提升和提取离不开对数据结构的认识,经管领域中传统数据处理的视角和思路不足以解决“大数据”中凸显的难题。以经管问题分析中的社会计算模式为例进行说明,社会计算中的网络分析和人本计算等热点研究领域,社区结构和人脑计算模式差异导致的数据增长体现了数据的“结构性”和“复杂性”,这类数据的价值提取过程可能涉及理论分析(比如分布式能源布置中影响因素及结构如何提取),技术过程梳理(比如“访谈—数据编码—问卷调查—统计分析—因素修正”等),最终需通过实践即算法训练来呈现实际问题分析结果和数据价值[1-5]。
数据间链接和综合作用过程体现操作性诉求。基于“微观—中观—宏观”视角的行为经济和行为管理研究成为经管领域的研究热点,其对理性、效用最大等假设进行了全面改善,强调个体差异及基于个体链接的中观及宏观现象解释,通过对实际经管问题的研究及匹配检验,得到行为决策的涌现过程(例如行动者模型等),并对数据点间的链接间断和链接创建进行理论分析,提出相应的假设,利用数据统计分析手段进行假设验证。在此基础上,对公共物品供给、群体决策等经管问题进行算法模拟,通过过程建模和模拟实验对数据的价值进行推理性再提取,实现数据价值的现实性和预测性的统一,并为产品营销、公物危机干预等实际问题提供操作化措施支撑,基于大数据的方法介入为公共政策及产品提供,异构数据的统计推断提供系统性方法[1],具有广泛、重要的工具价值,见图1所示。
数据科学框架中的前沿领域问题解决凸显了实际问题研究范式的变革,且这种变革过程中强调数据的结构性、关联性、完整性和统一性,对问题分析能力、数据获取能力、价值提取能力、结果反馈及干预能力提出了更为复杂的要求,对要求进行细致化深度回应才能科学呈现“问题发现—数据获取及分析—实际干预—干预评价”的完整闭环。
图1 数据科学框架内的四个前沿领域[1]
在统计理论中,数据增长具有“简单性”,它虽然能让数据推理在总体上变得更强大,引出渐进式结果。但经管领域内问题分析更应该认识到基础层面,数据价值提取与统计理论自身特点存在显著分歧。
现实生活中数据集规模的迅速增长,创造了关于数据科学新颖的基础性视角,这种视角是融合了推理和计算机科学的。数据点数量的增长是数据复杂性来源,需通过算法来进行训练。在数据处理的形式层上,统计学方法缺乏计算及推理理论模式,比如逻辑事实的结果是如何通过数据运行产生预测的。而在数据处理的核心层面和宏观现象展示时,核心的计算及推理理论中,又缺乏统计学的宏观数据描述,比如公共管理中群体性事件即“危机”预测的阈值选择。二者之间的差异和优劣势显而易见,经管类前沿问题研究中,需搭建计算及推理理论和统计理论之间的桥梁。例如在公共事务领域内隐私和交流限制下的推理问题,得到推理的速度和准确率之间平衡的模式,均体现了突破统计理论局限,并进行计算和推理融合的必要性。
一是新获批专业分布状况分析为突破传统经管专业人才培养模式提供了契机。国家教育部2018年新获批专业审核结果为经管专业视角拓展提供了新思路。专业分布院校统计显示大数据类专业是最为急缺专业,申请开办“数据科学与大数据技术”的学校达到了250所,另有5所学校申请开办“大数据管理与应用”,共计255所学校申请大数据类相关专业,而排在第2名的为“机器人工程”专业,申请获批开设学校仅60所,第10名为“软件工程”专业,申请获批学校仅为23所,见图2所示。在大数据类相关专业申请学校中,授予工学学位的186所,授予理学学位的64所,授予管理学学位的5所,见图3所示[6]。
图2 新获批专业的学校数统计
图3 数据类专业学位类型
数据类专业的学位授予突破了传统工学和理学的范畴,认为数据类专业范畴依据其解决实际问题领域差异可具有更为泛化的解读。这一理解契合了美国大学生数模竞赛遵循的理念(数学建模美赛强调交叉学科建模的重要性),更强调学科领域框架下的应用性,而弱化学科专业的概念。
二是美国数据科学类专业课程设置为经管专业人才培养模式变革提供了知识板块支撑。美国数据科学类专业课程设置分为四个板块:理论板块、技术板块、应用板块和实践板块。其中实践板块课程设置强调问题来源于工业、政府或非政府组织,强调学生应以实际经管类问题为导向,完善培养在问题凝练、问题科学化、质性分析、规范分析、理论建模到符号建模、数据获取、数据价值提炼、数据结构性推理和解决方案反馈等综合能力的全面塑造;理论板块课程设置强调统计类方法和逻辑推断类算法对学生基础能力的塑造;技术板块课程设置体现了经管专业人才培养的技术化趋势;应用板块课程设置体现了学科交叉背景下学生能力的自然延伸要求。
三是问题一体化解决诉求和学科交叉深化延拓了经管类人才培养的路径。经管类实际问题解决不仅依赖于基于理论板块和技术板块的课程设置和学生基础能力培养,其面临着越来越复杂的问题一体化解决全过程剖析。经管问题产生的背景是人的社会经济活动,有别于自然人的概念,在不同社会组织中参与多样化活动的主体人,其在特定时点的决策和经济活动不仅受自身属性、价值观及性格特征影响,更处在特定行为选择生态系统之中。正如勒温提出的行为选择公式B=f(P,E),决策结果依赖于三类事实[7],这就要求进行问题解决时,需对能力进行拓展,强化技术能力和社会及心理分析能力,即需要在“唯物”和“唯心”两个方向上同时进行延伸,完善经管类人才培养链条。
四是新经管专业人才培养的能力链条中计算和统计分析融合的能力培养是关键环节。大数据背景下经管领域内问题解决越发需要借助传统自然科学的研究范式“理论—模型—验证”,然而行动者间异质化,交往关系复杂,链接结构随时空演变,数据获取中还存在观点表述内隐化及语言不确定性,加之研究主体的隐私要求及“关系圈子”的伦理秩序考量,人才培养的理论板块需要更多的内容填充。人才综合能力的训练受制于知识框架的束缚,基于数据关联的推理能力培养正日益受到重视。以美国数据科学类专业课程开设为例,纽约大学开设《知识表示与推理》,伊利诺斯理工学院开始《密集型数据计算》,弗吉尼亚大学开设《大数据伦理》,加州大学圣地亚哥分校开设《数据集成》等课程正是体现了对学生计算和统计分析融合的基础能力培养要求。
经管类人才培养需进行两个方面的路径延伸,一类延伸着眼于数据获得和数据处理及展示方面,这种延伸是强调将更多节点纳入问题解决路径中,是路径长度的延伸;一类延伸着眼于基础理论学习和不同工具模块间的支撑和融合,这种延伸是强化节点间的纵向连接,是结构复杂度的延伸。因此,认为经管基础理论学习是进行各类工具融合的前提,而统计理论和计算理论是重要的工具模块,在基础学习之上,进行统计和计算理论工具融合为经管类人才培养提供了科学路径,见图4所示。
图4 基于统计与计算理论融合的人才培养逻辑路径
在图4的逻辑路径之中,首先需要强调的是经管专业基础理论模块的学习。这一板块的课程设计,不仅需要包含传统的微(宏)观经济学、管理学、政治经济学、金融学等,还需强调学生专业自主课程的学习,比如行为经济学、信息经济学、组织行为理论、认知心理学、公共管理理论等。通过传统基础理论的深入学习,结合自主阅读、学习、讨论,进一步强化对社会、经济活动中实际问题的认识,为科学问题的自主提出,运用统计和计算理论进行量化研究、评价和决策奠定理论和范式研究基础。
在统计类专业理论模块学习中,需以概率论与数理统计、统计学、多元统计分析、应用随机过程、时间序列分析等课程学习为基础,以Eviews、SPSS、R、AMOS等软件学习为工具媒介,以全国大学生市场调查与分析大赛、挑战杯(社会调查报告)等竞赛为抓手,强化经管类专业学生统计分析能力的延拓和提升。这一模块的能力提升需借助实验教学类课程的良好教学效果获得,还需借助以竞赛问题分析及竞赛数据统计分析等具体操作来实现。
这一模块的能力延拓和提升,不仅需要掌握、使用已有的公开(可售)的数据库获得数据,还需结合经济、管理的基础理论和实际问题,针对不同的实际问题,细化理论分析,在理论分析、质性分析(规范分析)的基础上进行自主的一些问卷数据及不同行为主体间关联关系数据获得,甚至还需要借助Python等软件进行网络数据爬取,甚至进行一些网络结构的获得及分析。这一模块所需要的细化的工具运用能力培养可包括:各类数据库的数据类型及查阅方式等,文本、音频、视频信息等多媒介信息的相互转换,数据库、网页搭建类计算机语言运用,质性分析到问卷的规范性编制,网络数据的抓取及分析能力,数据的可视化展示等。
在计算和推理类理论模块学习中,需以决策理论、运筹学、数理逻辑、计算方法、经济数学模型、博弈论等课程学习为基础,以Matlab、Citespace、QCA等软件学习为工具媒介,以全国大学生数学建模竞赛、美国大学生MCM/ICM竞赛、互联网+等竞赛为抓手,强化经管类专业学生的计算和推理能力培养。在这一培养过程中,需强化实验室自主实践训练,针对热点和前沿的经管类问题(例如社会网络分析中群体选择、消息传播、交叉博弈等)进行基础建模和计算、推理能力训练,重在强化从实际问题到逻辑推理及智能计算实现的训练。
这一模块能力的培养,需要首先进行经管类专业学生从传统经管理论模型分析到结合定量和逻辑运算的符号模型的思维模式转换,并且能够将这种符号模型的推演及计算结果反馈到经管实际问题的解释或解决中去。其次注重不同量化或逻辑推理方法适用性和优劣势的比较,比如AHP方法、模糊综合评价方法和QCA方法的适用性和优劣势差异比较,从而判断基于不同的目的和目标,如何选择合适的定性和定量结合的方法进行逻辑评判和决策。最后还需要对应于计算和逻辑推理结果进行政策建议或干预措施制定的训练,并将此项实施过程与传统的通过理论模型分析及实证的模式区分开来,以社会计算和符号逻辑推演的模式进行解读和论证。
如何通过统计和计算理论融合共同推动经管类专业学生的具体实践能力是件困难的事情,难以通过简单的路径约定有效率的实现。类比前文的模块实现方式,这里也提一些具体的做法和实现方式,首先应以图论、社会网络分析、行动者模型、抽样技术与应用、统计预测与决策等课程学习为基础,强化从理论分析到符号模型的规范过程,以社会网络链接及预测、神经网络、深度学习及自适应涌现等程序模块的学习、训练、应用为抓手,强调以横向课题(为同类或相似企业批量化解决实际问题)为训练依托,以实际问题研究与应用和效果评价为实战标的,完善学生创新能力全链条能力培养及衔接,基于全链条能力塑造和提升来推进经管类专业学生统计和计算理论共同驱动的实践能力培养和塑造。
在这一模块,尤其要认识到经管领域内的知识发展及演进日益受到“双重驱动”的重要性,关注数据驱动和算法(逻辑推理)驱动。数据驱动即价值化使用经管领域内研究问题的低价值当量数据;算法(逻辑推理)驱动即规范化发展符合经管类问题研究范式需要的算法和模型。 经管类具体问题中科学问题累积、低价值当量的海量相关数据获得、总体数据的统计性描述、异构数据点间作用逻辑推理、基于逻辑推理的结果预测及干预均会严重影响主体框架内数据及算法协同驱动效果,而协同效果的逐步提升依赖于实际问题完整解决的具体实践,这一模块需要特别强调实际问题导向。
模拟实际问题(社会组织特定企业框架下的心理生态系统评价):心理生态是一复杂系统,涉及个体群体心理状态、个体与群体内其他个体间关系、个体与环境(物理环境人文环境)间关系、群体整体与环境(物理环境人文环境)间关系。
参考方法(需学生自主研读并提出解决问题的逻辑框架):个体状态(心理状态)的质性分析到测度方法;生态系统的PSR, DSR和 DPSIR评价模型。
Step1:对研究问题进行质性分析,借鉴PSR, DSR和 DPSIR评价模型形成特定企业框架下的心理生态系统构建模块;
Step2:通过特定类型企业的心理生态构建模块,进行指标体系梳理、论证得到生态生态系统的理论模型;
Step3:对指标体系中评价变量和问题解决中的结果变量进行梳理,得到变量间的符号关系(计算及推理关系);
需要注意的是,实践中的变量划分为两类。其中评价指标变量(一级指标)分别为:个体状态;组织内关系;组织状态与自然环境间关系;组织状态与人文环境间关系;自然环境与人文环境间关系;资源补偿效果。评价结果变量分别为:状态变量;趋势变量。
Step4:借鉴个体心理状态(损害、职业损害等)、物理环境测度、人文环境侧端、社会关系测度等问卷,进行问卷调查;
Step5:根据问卷调查结果,使用两类指标(常模值均值、标准差)进行等级评定,得到逻辑推理计算中评价指标变量的初始逻辑值;
Step6:根据评价指标变量的初始逻辑值进行数理逻辑运算,得到评价结果变量的逻辑值,并通过逻辑值对特定类型企业的心理生态状况进行实际评价,并提出基于评价指标变量逻辑值的干预政策及建议[9]。
进行问卷调查后,得到统计性描述数据,以常模值均值为参照点(六类评价指标变量,测量二级维度三级维度达到142个)。低于两个标准差及以上的为优(逻辑值为1);低于一个标准差和两个标准差之内的个体数据的为良(逻辑值为2);低于一个标准差或高于一个标准差之内的为中等(逻辑值为3);高于一个标准差和两个标准差之内的个体数据的为较差良(逻辑值为4);高于两个标准差及以上的为很差(逻辑值为5)[9]。根据划定,每个一级评价指标变量的逻辑值xi∈{1,2,3,4,5},i=1,2,3,4,5,6,则心理生态系统基于统计性描述后的推理计算需要借助六维的五值向量E=(x1,x2,x3,x4,x5,x6),向量的逻辑类型共有65种。
依据一级评价指标变量建立评价结果变量的逻辑值推理及运算规则,并将五级指标值对应于相应的灰度值,得到前64类状态和趋势评价结果,如图5所示。
图5 基于统计与计算融合的心理生态评价灰度图(前64类)
根据图5中Y变量对应的灰度值可直观的进行特定企业的心理生态系统现有状态展示,通过z对应的灰度值可直观的进行特定企业的心理生态系统未来发展趋势展示。
总之,经管类专业人才培养需更加注重数据处理能力的提升,这与大数据和人工智能迅速发展的时代背景密切相关,也是经管类专业本身从理论分析、理论建模到符号模型,再到基于“微观—中观—宏观”结合视角的数据建模的必然要求。基于这种视角的问题分析与处理必然要求经管类专业学生强化传统统计理论与新兴的社会计算、推理理论的结合,迫切要求经管类专业在课程设置、实验教学、实践教学中进行有目的的引导和有具体操作方式的两类方法融合的实际问题解决训练。基于此,认为基于统计与计算理论融合的培养实践探索仍需不断强化。