赵婧文 李秀霞
摘要:文化振兴是乡村振兴的灵魂,也是推动乡村文化建设的重要手段。本研究以《农民日报》为数据源,结合文档向量化技术和聚类分析法,分析乡村文化建设主题的演化趋势。研究发现,2017—2019年关注乡村公共文化空间、乡村旅游等;2020—2021年关注乡村旅游、文明乡风、民俗传承等;2022—2023年聚焦古村落保护、农产品品牌化、数字乡村建设等。通过深入分析乡村文化建设的主题内容和演变轨迹,可为我国乡村文化建设提供参考借鉴。
针对我国凸显的农村发展不充分、城乡发展不平衡等现实问题,2017年,党的十九大报告提出实施乡村振兴战略,明确了“五大振兴”路径[1]。随着政策、资金、人才等要素向“三农”工作的持续供给,2020年底我国打赢脱贫攻坚战,乡村振兴取得阶段性成就。新发展阶段,乡村发展如何巩固拓展脱贫攻坚成果,同乡村振兴有效衔接成为新的时代命题[2]。文化振兴被置于重要位置,是乡村振兴的灵魂和精神动力[3]。如何实现乡村文化振兴是一个难题,也是乡村振兴中五大振兴中最困难的问题之一。《农民日报》是我国首家针对农村发行的报纸,也是乡村振兴战略报道的权威信源。本研究选取《农民日报》有关乡村文化建设报道为研究对象,具有较强的典型性和代表性,运用文本向量化技术和聚类分析法对比分析我国乡村文化建设的发展轨迹和变化趋势,旨在梳理乡村文化发展的阶段性演化历程,为其建设发展提供理论依据和决策参考。
相关研究
自乡村振兴战略推行以来,有关乡村文化建设的研究呈现跨越式发展,体现在数量、广度和深度等多方面。其中有纵向的追踪研究,李蕴哲、戴玉琴梳理了乡村文化在社会变迁中不断转型与重构过程[4],何卫平、张广利回顾了中国共产党乡村文化建设的百年探索并总结基本经验[5];同时也有诸如艺术[6]、人才[7]、思政教育[8]等不同领域的横向研究,其中也不乏对陕西安康金寨[9]、山东博山[10]、广西贺州瑶族[11]等乡村的样本分析。相关研究有理论探索,也有实践分析,取得了丰硕成果。
主题演化是用于预测某一领域未来发展趋势的重要手段[12]。运用引文分析[13]、内容分析[14],引文分析与内容分析结合的方法[15],以及词嵌入技术、文档嵌入技术[16]等手段广泛应用于繁杂文本的主题演化分析中。不同的分析方法由于技术原因也显示出无法避免的缺陷,如引文分析法存在一定的时间滞后性且分析对象粒度过大;共词分析法存在未考虑低频词、缺乏语义关联性、聚类效果差等问题;主题分析法仅从词的层面提取主题,词间的语义关联性差[17]。
农村文化建设提出已有30多年,相关研究取得丰硕的成果。多数研究数据来源集中于现有的政策文件、政府报告和实地调研,以新闻报道为基础数据的研究较少,尤其缺乏运用文档嵌入方法开展乡村文化建设的研究。因此,本研究选取乡村振兴战略提出之日(2017年10月)至2023年6月间《农民日报》中与乡村文化建设有关的报道为研究数据。考虑到日报中新闻文本篇幅不一且缺少关键词和摘要,以及上述四种主题演化分析方法存在缺点等现实问题,遂采用摘要生成技术、Doc2vec文档向量模型、K-means聚类算法以及可视化技术等研究方法探析我国乡村文化建设的发展进程,旨在探析我国新农村文化建设的发展进程,为推动乡村文化建设实践和研究提供重要参考。
实证研究
研究流程
本研究以《农民日报》新闻报道为基础,通过摘要生成和语义相似度分析揭示我国乡村文化建设主题的演化趋势。核心步骤包括:数据收集与处理,按发布时间整理新闻报道;摘要生成,在数据预处理基础生成文本摘要;文本向量化,借助Doc2vec模型将每篇摘要向量化;摘要语义聚类,采用K-means聚类算法进行分析;比较分析,横纵对比各时间段内主题内容的共性与差异,从主题关联维度分析演进路径和趋势。
数据来源及预处理
通过中国知网报纸导航功能定位到《农民日报》专栏以及《农民日报》电子版,检索主题为“文化”,时间范围为2017年10月—2023年6月。编写爬虫程序共采集1 006篇报道,去除无关条目后最终获得844条有效条目。
2017年首次提出乡村振兴战略,由此将2017—2019年作为第一个时间段;2020年是全面建成小康社会和脱贫攻坚关键年,确定2020—2021年为第二个时间段;中国共产党第二十次全国代表大会于2022年召开,对全面推进乡村振兴和农业强国建设作出重大部署,将2022—2023年作为最后一个时间段。从中提取日期、标题、正文字段形成初步语料集,以csv格式保存(见表1)。
表1 时间切片划分
时间切片序号 1 2 3
时间段切分 2017.10.18—2019.12.30 2020.1.1—2021.12.30 2022.1.1—2023.6.30
新闻报道数目 355篇 250篇 239篇
摘要生成
在进行摘要生成之前,需要对原文本进行一系列的预处理工作,包括去除特殊字符、标点符号,以确保文本格式一致性。摘要生成旨在对文本进行压缩、概括,分为生成式和抽取式方法。生成式以语义表示生成摘要,但存在准确性和长度控制等缺陷[18]。相比之下,抽取式方法通过计算句子或词的重要性权重,无监督地抽取关键信息生成摘要,技术成熟且广泛应用。鉴于生成式方法的缺陷,本研究选择了抽取式方法进行摘要生成。
文档向量化
文本向量化是指提取文本特征,将文本数值化可用于计算和分析。Doc2vec文档向量模型考虑了被处理词的上下文信息,由此,训练得到的向量包含了丰富的语义和语法关系。将摘要生成阶段的结果输入到Doc2vec模型中进行学习,训练获得句向量表。
在实际训练中,本研究以新闻报道摘要分词后的结果为语料库对模型训练。模型参数设定如下:dm设为0,即本次实验使用PV-DBOW模型,window设为5,min count设为2,vector size设定为100,epochs设为20。
文档聚类
借助K-means聚类算法将文档向量进行聚类。K-means算法是一种经典的无监督学习算法,效率高、收敛快速、能够高效处理大规模数据集。该算法根据用户最初定义的K值设置簇中心点,将距该簇中心点最近的数据点分配给簇中心点,再把这些数据的平均值设为簇中心点,迭代至各个簇中心点不再变化为止[19]。
观察手肘图发现三个时间段的最优聚类数K值分别为5、6、5,由此,将上述三个时间段的文本分别聚为5类,6类和5类。针对同一个聚类,选取各聚类下平均权重最高的10个词作为该类的关键词,用于后续结果分析。
结果分析
2017年—2019年的主题内容
第一时间段新闻报道分为5类主题:乡村公共文化空间建设、乡村旅游、农村人居环境治理、脱贫攻坚和文化扶贫、农业文化遗产和非物质文化遗产保护。
第一,乡村公共文化空间建设得到重视,通过设立农家书屋、文化礼堂等吸引农民参与,鼓励全民阅读,提升农民群众的获得感和参与感,补齐了农村公共文化服务短板。第二,发展乡村旅游充分利用乡村旅游资源,带动脱贫致富。第三,农村人居环境整治实践包括垃圾分类、厕所改造等,促进人与自然和谐共生。第四,脱贫攻坚通过创新扶贫方式,结合精神文明建设,激发贫困群众内生动力,为全面建成小康社会奠定基础。第五,通过将农业文化遗产与生态文明建设、扶贫攻坚等有机结合,将遗产地打造成为乡村振兴的典范,提升其影响力和品牌价值,使乡村成为一个宜居、幸福、承载乡愁记忆的故土家园。
2020年—2021年的主题内容
第二时间段新闻报道分为6类主题:乡村旅游、文明乡风建设、特色民俗文化传承和保护、特色农产品品牌、文化扶贫及保护农业文化遗产。
第一,自党的十八大以来,乡村旅游规模不断扩大,体系不断完善,以发展乡村旅游为中心,为推进脱贫攻坚和乡村振兴提供了源源不断的产业动能,让“绿水青山”变成“金山银山”。第二,通过开展文明乡风建设,积极实践社会主义核心价值观,活化文化价值,助力实现乡村振兴。第三,《中华人民共和国乡村振兴促进法》颁布,明确规定各级人民政府应大力支持三农题材文艺创作,鼓励创作反映农民生活的优秀文艺作品[20]。第四,打造特色农产品品牌,通过深挖农业文化遗产潜在价值,用产业带动农村经济增长,实现共同富裕。第五,文化扶贫注重基层公共文化服务,补齐基层文化振兴“最后一公里”短板。第六,保护农业文化遗产助力生态发展。借助农业文化资源打造特色生态农业模式,助力生态发展。
2022年—2023年的主题内容
第三时间段新闻报道分为5类主题:古村落保护与乡村博物馆、农产品品牌化、文明乡风建设、农业文化遗产保护和数字乡村建设。
第一,2022年中央一号文件明确提出保护特色古村落。第二,农产品品牌化推动“三品一标”发展,提升农产品品质。第三,文明乡风建设是乡村振兴的核心。通过农家书屋宣传核心价值观,培育好家风,促使核心价值观深入人心。第四,挖掘非遗文化潜在价值,助推乡村振兴和农业强国建设。第五,建设数字乡村,应用数字化技术提升乡村治理能力,借助短视频平台传播乡村文化,打造数字乡村[21]。
2017-2023年七年间乡村文化建设主题内容演化趋势分析
通过上述研究可得出每个时间段内各自特点:2017—2019年主要工作围绕乡村振兴战略进行;2020—2021年是实现第一个百年目标的历史交汇时期,侧重扶贫工作和全面建成小康社会开展;2022年至今则将数字乡村作为主推方向,持续用科技为乡村发展赋能。随着时间推进,上述主题在演化中出现交叉、融合,其演化趋势用桑基图表示(见图1)。
图1 各时间段内主题演化桑基图(作者自绘)
纵向对比“农业文化遗产和非物质文化遗产保护”主题演化变迁,发现其与“民俗文化”“农产品品牌化”关联紧密,涉及农村经济、文化遗产等多领域。该主题在不同时期不断分裂与融合,呈现显著的演化关系。2020—2021年分裂为“传承特色民俗文化”和“打造特色农产品品牌”;2022—2023年更进一步分裂为“古村落保护和乡村博物馆”“农产品品牌化”和“数字乡村建设”。
在主题演化路径上,2022年以来“数字乡村”作为新兴热点突显,体现了我国乡村振兴战略数字化趋势。该主题与2017—2019年的乡村公共文化空间建设、乡村旅游等紧密相关,同时与2020—2021年的文明乡风建设、以及保护农业文化遗产主题存在演化关系。数字经济助推文明乡风建设,农民通过数字经济发展旅游业增收的同时,也保护了农业文化遗产。数字经济通过直播、短视频等新型媒介进行推广和传播乡村文化,进一步提升其知名度和影响力。
本研究利用摘要生成技术、Doc2vec模型和K-means算法,从《农民日报》角度分析乡村文化建设新闻主题演化趋势。研究创新之处在于从新闻报纸视角研究政策应用演化;通过摘要生成技术精简新闻内容;以文档语义分析揭示主题信息。本研究也存在局限性,如数据来源单一,仅限于《农民日报》;K-means算法聚类效果未经验证。未来研究可扩大数据样本,采用多种聚类方法对比并设置评价指标检验聚类效果,以提高分析结果可靠性。
未来,乡村振兴应以文化为核心。传承传统文化,通过发展乡村旅游激发保护古村落和古建筑的活力,提振乡村文化振兴内在动力。运用现代信息技术,搭建互联网技术快车,构建城乡文化输送通道,盘活农家书屋等公共资源,为农民提供个性化文化服务。关注乡村人才培养,以人为核心推动农村振兴。唯有如此,文化才能留才,为乡村振兴铸魂。
参考文献:
[1]习近平.决胜全面建成小康社会夺取新时代中国特色社会主义伟大胜利——在中国共产党第十九次全国代表大会上的报告[M].北京:人民出版社,2017.
[2]习近平.高举中国特色社会主义伟大旗帜 为全面建设社会主义现代化国家而团结奋斗——在中国共产党第二十次全国代表大会上的报告[M].北京:人民出版社,2022.
[3]吕宾.乡村振兴视域下乡村文化重塑的必要性、困境与路径[J].求实,2019(02):97-108+112.
[4]李蕴哲,戴玉琴.乡村文化建设的历史变迁、现实审视与路径选择——基于文化治理的视角[J].观察与思考,2021(12):99-106.
[5]何卫平,张广利.中国共产党乡村文化建设的百年探索、基本经验及新时代展望[J].理论月刊,2021(10):13-21.
[6]刘琪.艺术参与乡村建设的审视与思考——以乡村文化振兴为视角[J].社会科学家,2022(09):142-148.
[7]时伟.大学生融入乡村文化建设的有效路径[J].人民论坛,2022(Z1):120-122.
[8]袁志香.以核心价值观为引领的思政教育对乡村文化建设的影响研究[J].农业技术经济,2022(04):146.
[9]庞莉,陆路.新民风建设引领乡村文化创新发展——乡村文化建设的安康金寨实践[J].图书馆论坛,2021,41(04):53-59.
[10]毛一敬.乡村文化建设的本土化实践路径探析——基于山东博山基层文化建设实践的考察[J].中共宁波市委党校学报,2021,43(03):121-128.
[11]李凯,龚晨,刘煜.乡村振兴视域下乡村文化生态重塑的现实困境与纾解策略——基于广西贺州瑶族乡村的样本分析[J].广西民族研究,2022(06):146-152.
[12]刘怀兰,刘盛,周源,等.基于多源文本挖掘的技术演化路径识别[J].情报理论与实践,2022,45(11):178-187.
[13]Small H G.A co-citation model of a scientific specialty:a longitudinal study of collagen research[J].Social Studies of Science,1977,7(02):139-166.
[14]Neff M W, Corley E A. 35 years and 160,000 articles: A bibliometric exploration of the evolution of ecology[J]. SCIENTOMETRICS, Dordrecht: Springer, 2009,80(03):657–682.
[15]冯立杰,周炜,刘鹏,等.基于引文网络和语义分析的技术演化路径识别及拓展研究[J].情报理论与实践,2023,46(01):90-99+131.
[16]程秀峰,邹晶晶,叶光辉,等.融合Word2Vec的半积累引用共词网络的领域主题演化研究[J].情报学报,2023,42(07):801-815.
[17]赵一鸣,吕鹏辉.学科知识网络研究(Ⅲ)共词网络的结构、特征与演化[J].情报学报,2014,33(04):358-366.
[18]夏吾吉,黄鹤鸣,更藏措毛,等.基于无监督学习和监督学习的抽取式文本摘要综述[J].计算机应用,2024,44(04):1035-1048.
[19]朱凡,王印琪.基于k-means与神经网络机器学习算法的用户信息聚类及预测研究[J].情报科学,2021,39(07):83-90.
[20]中华人民共和国乡村振兴促进法[J].农村工作通讯,2021(12):4-10.
[21]郭美荣,李瑾,马晨.数字乡村背景下农村基本公共服务发展现状与提升策略[J].中国软科学,2021(07):13-20.
(作者单位:曲阜师范大学传媒学院)