基于因子分析和贝叶斯方法的农村居民参与数字乡村建设意愿的分析研究

2022-04-02 03:32田忆嘉,张维朋,吴钇蒙
电脑知识与技术 2022年33期
关键词:贝叶斯网络数字乡村因子分析

田忆嘉,张维朋,吴钇蒙

摘要:乡村振兴是十九大提出的一项重大战略部署,针对浙东地区数字乡村政策下农村居民的参与意愿现状,从参与态度、参与的主观规范、感知控制行为、参与行为意向、参与数字乡村建设行为倾向、实践参与度方面设计问卷并收集数据。利用因子分析,得出政府活动与个人参与因素为主要的因素,其次是科技环境、实现价值、政府媒体影响等因素。利用贝叶斯网络分析,得出农村居民愿意参加数字乡村中,政府活动与个人参与值越高的政府媒体影响越低,科技环境影响越高,实现价值越高。该文提出改变宣传侧重点,加强科技建设和信息使用服务,增强居民参与的积极性和参与的热情,加强管理工作和行为规范,提升自我价值和不同群体参与率,为提升我国农村居民参与行为提供建议及理论参考。

关键词:数字乡村;因子分析;贝叶斯网络;问卷设计

中图分类号:TP393    文獻标识码:A

文章编号:1009-3044(2022)33-0108-04

在中国数字经济快速发展的乡村振兴环境下,数字信息技术向乡村社会的扩散与嵌入,改变了乡村社会固有的结构和形态,乡村研究面对的,不再是传统乡村,而是一个被数字技术改造、正在走向城乡融合的乡村[1-3]。数字乡村这一概念受到了学术界和实践界的广泛关注。但随之而来的乡村内部矛盾凸显、城乡差距进一步扩大的情况持续存在,而其中最主要的是农村居民的主动性不够的问题,使得数字乡村政策的发展迟缓,在某种程度上影响了农村的长远发展。

目前,我国有关于数字乡村建设的研究,大多研究聚集在数字乡村基础设施建设及经济数字化发展,甚少从村民参与意愿角度去做研究。通过对浙东地区农村居民的现状了解村民参与意愿,分析哪些因素影响了农村居民参与数字乡村的意愿[4-5]。有助于进一步解放和发展农村数字化生产力,对加快乡村的发展提供动力。

1 问卷的设计与检验

1.1 问卷设计

本文主要研究的是在乡村振兴战略下浙东地区居民参与数字乡村意愿影响因素的研究,数据收集主要采用问卷形式,通过微信和链接发布获得数据,再由问卷星导出数据。

问卷调查设计主要分为三部分:第一部分,旨在调查个人因素与参与意愿之间的关系,涉及被调查人员的年龄、性别、职业、年收入等基本信息。第二部分,对于数字乡村的了解及参与意愿的影响因素。旨在理解浙东地区农村居民在数字乡村振兴战略中的参与情况,了解存在哪些问题。问卷通过六个参与意愿的影响因素,使用李克特 5 级量表计算不同题目的得分。第三部分,数字乡村参与度,通过对参与度的调查了解信息。

1.2 问卷信度效度检验

1.2.1 信度检验

[α=kk-11-s2is2x]信度试验是指对问卷的真实性试验,即在使用相同的方式对同一个对象重复检测时得出结论的一致性程度,也就是反映了实际状况的程度。本文将通过克隆巴赫系数对问卷数据进行可信度检测,其公式为:

[α=kk-11-s2is2x]                  (1)

式(1)中[α]为信度系数,[k]为题目数量,[s2i]为在第i题上的分数变异,[s2x]为总分的方差。本文Cronbach's Alpha为0.853,即样本数据通过了信度检验,问卷有效。

1.2.2 效度检验

效度即有效性,它是指通过测定工具或技术手段可以正确测量所要测定的事物的程度。本文的效率试验使用了KMO和巴特利特球形试验。KMO检验问卷的效度,计算公式为:

[KMO=∑i≠jr2ij∑i≠jr2ij+∑i≠jr2ij·1,2...k]           (2)

巴特利特球形检验变量是否独立。计算公式为:

[k2=1c[(n-r)lnMSe-i=1r(ni-1)lns2i]]     (3)

[c=1+13r-1[i=1r1ni-1-1n-r]]

其中:

根据式(2)和式(3)计算结果,本研究的KMO值为0.848,Bartlett球形检定显著性小于0.05,表明问卷通过效度分析。

2 因子分析模型在数字乡村中的应用

2.1 提取公因子

因子分析中的因子是否适用于提取因子,采用巴特利特球形检验及 KMO 检验对其进行了分析[11]。本文KMO=0.0.848,Bartlett球形检验的卡方值为3326.764,p=0.0001<0.01,达到了显著性水平,说明相关矩阵不是单位矩阵,有公共因子存在,适合进行因子分析。本文选取了29个居民对数字乡村参与意愿影响因素作为因子分析的变量,表1为总方差解释表。从表中可以看出,前8个因子的累计方差贡献率为62.086%,大于50%,由此可以认为本文的影响维度能够较好地反映出29个变量的基本情况。

2.2 因子旋转和因子命名

因子载荷阵旋转的主要目的,是为了使负载矩阵的元素平方值呈两极分化,以便于可以更好地得到每个公因子下的代表性变量,以方便通过对代表性变量的共性总结来对公因子进行命名。利用方差极大法对因子载荷矩阵进行正交转动后,使因子有了命名解释性,将阈值设置为0.5,少于0.5的成分将不予显示。表2列示了旋转后的成分矩阵,可以发现,每一公因子所在列下均有超过0.5 的代表性变量,因此可以继续进行公因子的命名分析。

由表 2为旋转后的因子载荷。从表中可以非常明显地看出第一个公共因子在变量X 8、X 9、X10、X11、X 12、X 14、X 15、X 16、X 17、X 18 上有较大的载荷,说明十个变量有很强相关,命名为政府活动与个人参与。第二个公共因子在变量 X 19、X 20、X 21、X 22、X 23上有较大载荷,可以看出这五个变量与互联网科技信息化有关,因为使用科技的程度不同导致的参与度不同,故命名为科技环境。第三个公因子在变量 X 3、X 4、X 7、X 13 上有较大载荷,可以看出这四个变量与实现自我价值有关,故命名为实现价值。第四个公因子在变量 X 26、X 27、X 28 上有较大载荷,可以看出这三个变量与数字乡村中村民的生产生活中的琐事有关,故命名为生产生活。第五个公因子在变量 X 5、X 6 上有较大载荷,可以看出这两个变量与政府媒体引导有关,故命名为政府媒体影响。第六个公因子在变量 X 24、X 25 上有较大载荷,可以看出这两个变量与信息平台使用程度有关,故命名为信息使用。第七个公因子在变量 X 1、X 2 上有较大载荷,可以看出这两个变量与数字乡村中建设条件改善的经济有关,故命名为经济利益。第八个公因子在变量 X 29 上有较大载荷,可以看出这个变量与数字乡村中物流产品配送有关,故命名为产品配送。与旋转前相对比,因子含义较为清晰。

2.3 因子方法结果分析

采用回归方法对各因子的得分系数进行估算,得到了各因子得分系数:

Y1 = -0.049 X 1 + 0.071X 2 - 0.003X 3 - 0.018 X 4 - 0.0200 X 5 + 0.0370 X 6 - 0.106 X 7 +0.1130X 8+ 0.126 X 9 + 0.213X 10 + 0.192 X 11 + 0.177 X 12 - 0.046 X 13 + 0.098 X 14 + 0.102 X 15 + 0.097 X 16+ 0.178 X 17 + 0.185X 18 - 0.077 X 19 - 0.126 X 20 - 0.083X 21 - 0.0890 X 22 + 0.013X 23 - 0.0110 X 24- 0.011X 25 - 0.0720 X 26 + 0.144 X 27 + 0.012 X 28 - 0.024 X 29

Y2 = -0.030 X 1 - 0.067 X 2 + 0.067 X 3 + 0.2160 X 4 + 0.0450 X 5 - 0.1000 X 6 - 0.0440 X 7 - 0.040 X 8- 0.007 X 9 - 0.046 X 10 - 0.095X 11 + 0.024 X 12 + 0.062 X 13 + 0.074 X 14 - 0.0860 X 15 + 0.0120 X 16- 0.178 X 17 -0.056 X 18 + 0.045X 19 + 0.330 X 20 + 0.321X 21 + 0.284 X 22 + 0.221X 23 - 0.0070 X 24+ 0.003X 25 - 0.113 X 26 - 0.060 X 27 + 0.019 X28 - 0.006 X 29

Y3 = -0.103X 1 - 0.027 X 2 + 0.308 X 3 + 0.096 X 4 - 0.072 X 5 + 0.4130 X 6 + 0.4520 X 7 - 0.0120 X 8- 0.092 X 9 - 0.035X 10 + 0.082 X 11 - 0.064 X 12 - 0.017 X 13 - 0.140 X 14 + 0.0770 X 15 - 0.0390 X 16- 0.053X 17 + 0.029 X 18 + 0.180 X 19 - 0.077 X 20 - 0.027 X 21 - 0.075X 22 - 0.060 X 23 + 0.0510 X 24- 0.084 X 25 - 0.088 X 26 +0.035X 27 + 0.012 X 28 + 0.094 X 29

其余公式一樣,以八个因子的方差贡献率为权重,得出综合得分为:

Y = 0.267 /(0.267 + 0.072 + 0.063 + 0.052 + 0.046 + 0.041 + 0.039 + 0.034)×Y1 + 0.072 / 0.614 × Y2+ 0.063 / 0.614 × Y3 + 0.052 / 0.614 ×Y4 + 0.046 / 0.614 ×Y5  + 0.041 / 0.614 × Y6  + 0.039 / 0.614 × Y7+ 0.034 / 0.614×Y8

由综合得分可知,在政府活动与个人参与因子中X10(政府产业发展培训指导完善)、X11(政府政策扶持力度大)权重较高,说明这两个指标有较大的相关性,而科技环境、实现价值、生产生活、政府媒体影响、信息使用、经济利益、产品配送因子的权重相对来说较为平均,与因子实际含义相一致。

3 贝叶斯网络在数字乡村中的应用

贝叶斯网络是以贝叶斯公式为基础的概率网络。贝叶斯网络是一种以求解复杂设备不确定性、相关性等问题为目标的概率推理,在多个领域中获得广泛应用。

3.1 贝叶斯网络建立分析

贝叶斯网络重要程度分析:如图 1 显示的是贝叶斯网络有向无环图。该节点表示一个输出变量,它是其他节点的父节点。蓝色的节点表示一个输入的变量。变量的重要性用蓝色的深浅来表示,颜色越深,其重要性就越大。从贝叶斯网络看,政府活动与个人参与是科技环境、政府媒体、信息使用和产品配送的父节点。说明性别主要依赖于这四个变量,它对是否参与数字乡村活动的作用并不完全取决于自身,还受到这四个因素的影响。性别受到实现价值和职业的影响,说明对于是否参与数字乡村受到这两个因素的影响。另外,经济利益对农村居民是否参与数字乡村还取决于年龄和年收入,也就是说,政府活动与个人参与固然重要,但也要看村民的年龄和年收入。实现价值是对农村居民是否参与数字乡村还取决于政府活动与个人参与,而政府个人参与取决于生产生活。

3.2 贝叶斯网络研究结果分析

贝叶斯网络可以得出:影响农村居民参与数字乡村的最重要因素是政府活动与个人参与,其次是实现价值、生产生活等。在愿意参与数字乡村的村民中,在政府活动与个人参与值越高的情况下政府媒体影响越低,信息使用概率越低,科技环境影响越高,实现价值越高,产品配送的概率越高。政府活动与个人参与值较低的生产生活影响越高。年龄在 23-45 岁且经济利益也较低参与数字乡村的可能性较大。女性中参与数字乡村的实现价值越小。女性中不参与数字乡村的职业为城镇中小企业员工的概率较大。年收入在 30 万以上且年龄在 56 岁以上的参与数字乡村的可能性较大。年收入在 5~10 万的年龄在 23~45 岁的不参与数字乡村概率较大。

4 总结

因子分析中可以看出农村居民参与数字乡村的影响因素可以概况为政府活动与个人参与、科技环境、实现价值、生产生活、政府媒体影响、信息使用、经济利益、产品配送等因素。政府活动与个人参与因素为主要的因素,政府是农村居民参与数字乡村的根本要素,政府可以通过改变农村生活的环境满足农村居民的生活需要,提高经济发展,大力发展农村经济,提高基础的信息建设,使农村居民生活便利。

贝叶斯网络中可以看出影响农村居民参与数字乡村的最重要因素是政府媒体影响,其次是实现价值、生产生活等。参与数字乡村的农民中,政府活动与个人参与值越大政府媒体影响的概率越低,可能的原因是个人与政府如果能够积极参与数字乡村那么媒体的宣传作用所带来的影响就自然会下降。参与数字乡村的农民中,科技环境越高政府活动与个人参与值越高,可能的原因是科技环境的提升带动了农村的发展,农村居民看到农村的发展越好便会主动参与到数字乡村的建设中。

参考文献:

[1] 苏岚岚,彭艳玲.数字乡村建设视域下农民实践参与度评估及驱动因素研究[J].华中农业大学学报(社会科学版),2021(5):168-179,199.

[2] 沈费伟,袁欢.大数据时代的数字乡村治理:实践逻辑与优化策略[J].农业经济问题,2020,41(10):80-88.

[3] 张鸿,马超,杜凯文.乡村振兴战略下农村高质量发展测度研究——基于陕西951份调研问卷的实证分析[J].西安财经大学学报,2021,34(4):27-39.

[4] 葛宣冲,张桂金,韩克勇.流动性、现代性与村民的乡村建设参与意愿——基于CLDS2016数据的分析[J].东岳论丛,2019,40(11):132-140.

[5] 李灿,吴顺辉,李景刚.村庄发展、资源禀赋认知与农村居民参与村庄建设意愿——基于575份农村居民问卷调查的实证分析[J].农林经济管理学报,2021,20(4):542-551.

【通联编辑:朱宝贵】

猜你喜欢
贝叶斯网络数字乡村因子分析
数字乡村战略推进的逻辑
数字普惠金融与数字乡村协同发展探究
以“数字乡村”战略统筹推进新时代农业农村信息化的思考与建议
无人机数据链测试与评估研究
基于贝叶斯网络的流域内水文事件丰枯遭遇研究
基于贝叶斯网络的城市居民出行方式研究