基于四螺旋理论的旅游业职业发展预测模型分析①

2023-11-05 11:00袁子薇
关键词:因变量决策树线性

袁子薇, 孙 伟

(1.浙江旅游职业学院,浙江 杭州 310000;2.韩国又松大学,韩国 34606;3.山东济南齐鲁工业大学,山东 济南 250000)

0 引 言

1 指标设计

企业发展中,人力资源管理活动的目标即挖掘利用人力资本积累获得发展。员工个人发展中,支持其职业发展行为的内在要素也即私人层面的知识与信息,因而需要依赖于有效的知识生产模型。传统上,基于大学教育等学校教育模式分析知识生产,则引入了产业活动对知识生产的支持和引导,又增加政府参与等因素,构成知识生产动力机制的三螺旋模型。与此同时,另一类知识生产动力机制分析的三螺旋模型则基于大学、产业和公众等三方参与,公众参与能够保障社会效益而避免知识经济化与自然环境恶化等问题和不足。两类模型同化构成四螺旋模型,也即大学-产业-政府-公众共同参与的知识生产动力机制,相关领域亦有一定先行研究进行分析。许礼刚等(2021)介绍了四螺旋理论,基于此分析多元主体驱动下创新教育模式,认为社会公众加入监督方参与的四螺旋结构动力机理与协同机制能够支持全方位创新教育体系的发展。

四螺旋理论中,不同维度参与知识生产与利用环节的参与多样,其大体可分为主体参与、成果产出等两方面因素,从而形成利益相关方参与知识生产和利用的必要基础。本文为分析和讨论旅游业从业人员职业发展情况的预测分析,相应构建指标体系以探讨四螺旋理论中不同主体的不同参与对知识生产和利用、及其具体表现的职业发展情况预测能力。基于此,区分变量,整理这一指标体系如表1:

表1 指标选取

2 数据获取

2.1 问卷编制

问卷调查内容包括自变量与因变量两部分内容。其中,自变量为被访者既往2至4年的自我评价内容,其题干描述为“您对3年前自身X评价如何?”,因变量为被访者当前职业发展状况评价。问卷题项使用七级李克特等距量表,其内容及其赋值如表2:

表2 问卷题项

2.2 问卷发放与回收

调查问卷使用线下环节纸质问卷发放,发放对象为旅游业从业人员。经线下调查人员的问卷发放、回收后,收集整理问卷内容,共获得194份问卷,剔除污损、空白和未完成问卷,保留183份有效问卷。这一问卷有效率为94.3%,能够支持调查问卷数据的有效分析。

2.3 问卷质量检测

为验证调查问卷数据的有效性,相应进行信度检验与效度检验。

其中,信度检验结果如表3:

表3 信度分析

其结果表现优秀,信度检验通过。

效度检验结果如表4:

表4 效度检验

其结果表现优秀,效度检验通过。

3 数据分析

基于上述数据进行分析,模型使用Stata16.0进行数据预测。

3.1 线性回归

首先,模型采用线性回归分析,建立各自变量与因变量间的关联性,从而形成自变量对因变量的预测能力。这一分析结果如表5:

表5 线性回归结果

如表5所示,线性回归分析结果所形成模型的解释能力较强,各自变量均对因变量有显著积极影响,且结果在99%置信空间下显著。对比各类指标的影响情况,则产业侧指标的影响更为显著,其次为大学与政府影响,公众类指标的影响则呈现显著分化特点,其中社会监督制衡能力的评价对现有职业发展的积极影响显著较强,而社会效益成果所带来影响则显著较弱。

基于这一线性回归分析结果,将各自变量用于预测因变量,对比预测值与真实值差异性,其结果如图1:

图1 线性回归预测结果对比

如图1所示,线性回归分析预测结果的波动幅度较大,结果偏差则相对较小,预测值与真实值无显著偏移。

这一结果有效验证了线性回归分析用于旅游业从业人员职业发展前景的预测能力,且依赖于有限指标的基础分析方法,因而有着较高推广利用价值。

3.2 决策树分析

继而,构建决策树分析模型。训练集与测试集数据切分为0.7,不进行数据洗牌和交叉验证,特征划分点选择标准为最优划分,树的最大深度10。其分析形成各指标重要性评价结果如表6:

表6 决策树指标重要性分析

如表6所示,基于原有数据进行决策树模型分析的结果显示,对因变量产生影响最显著的指标为社会监督制衡能力评价,这一结果亦符合线性回归分析的结果。政府引导行业发展评价等指标对因变量的影响亦显著较强,此后企业研发与创新产出等指标的重要性则显著低于前述指标,影响相对较弱。大学环境中的知识产出对因变量影响最弱,说明旅游业从业人员的职业发展对学校教育的依赖性较弱。

基于这一分析结果,对比预测值与真实值差异性,其结果如图2:

图2 决策树预测结果对比

如图2所示,基于决策树的预测结果与真实值偏差相对有限,数据波动幅度较线性回归等分析结果相对较低。对于这一预测结果的误差情况进行整理,其结果如表7:

表7 决策树分析结果的误差分析

如表7所示,模型R方表现较好,误差总体规模相对可控。

3.3 xgboost回归

最后,进行xgboost回归。训练集与测试集数据切分为0.7,不进行数据洗牌和交叉验证,学习率0.1,树的最大深度10。其分析形成各指标重要性评价结果如表8:

表8 xgboost回归指标重要性分析

如表8所示,xgboost回归所形成指标重要性分布情况大体与决策树分析结果相似,以社会监督制衡能力评价与政府引导行业发展评价为重要性最高的两类变量,而以大学教育成绩评价为重要性最低的一类指标。但其他指标分布中,则xgboost回归与决策树分析模型的分析结果有一定差异性,表现为既往学术成果产出评价等指标的重要性相对上升,且多数指标的重要性相对下降。

基于这一分析结果,对比预测值与真实值差异性,其结果如图3:

图3 xgboost回归预测结果对比

如图3所示,xgboost回归的预测结果亦与真实值较为接近。对于这一预测结果的误差情况进行整理,其结果如表9:

表9 xgboost回归分析结果的误差分析

如表9所示,模型R2较决策树模型分析结果表现较好,预测值与实际值的差值整体较小,但绝对误差上升,说明数据偏差具有整体方向性,较决策树分析结果有着整体偏差。根据指标影响与预测结果散点图材料分析,则其表现为数据预测结果整体偏低。

4 结 语

基于调查问卷数据分析了旅游业从业人员职业发展前景的预测模型,模型分析结果显示决策树模型能够较好的应用于这一模型分析,基于有限自变量指标预测因变量,xgboost回归尽管有着较低的均方误差,但预测结果整体偏低,因而误差较大而实践应用价值相对较弱。实证分析结果亦反映出,社会监督制衡能力评价与政府引导行业发展评价等指标能够较好预测三年后被访者职业发展情况。

猜你喜欢
因变量决策树线性
渐近线性Klein-Gordon-Maxwell系统正解的存在性
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
线性回归方程的求解与应用
一种针对不均衡数据集的SVM决策树算法
适应性回归分析(Ⅳ)
——与非适应性回归分析的比较
二阶线性微分方程的解法
决策树和随机森林方法在管理决策中的应用
偏最小二乘回归方法
基于决策树的出租车乘客出行目的识别
基于肺癌CT的决策树模型在肺癌诊断中的应用