基于CiteSpace软件的江淮官话研究可视化分析

2022-09-22 01:11吴小芳
宿州学院学报 2022年8期
关键词:官话视图热点

王 敏,吴小芳

滁州学院外国语学院,安徽滁州,239000

根据《中国语言地图集》的方言分区,皖属江淮分水岭地区所使用的方言主要是江淮官话[1]。江淮官话承载着江淮分水岭地区的地理风情、历史风俗和文化交流,客观全面地总结梳理江淮官话相关研究成果对于推动江淮官话地区的文化发展具有重要意义。信息可视化分析软件CiteSpace基于共引分析理论和寻径网络算法,对文献进行计量,绘制可视化图谱,为实现这一目标提供了新工具。文本使用 CiteSpace 软件对近10年发表的江淮官话相关文献进行施引文献分析,描述知识基础,探寻研究前沿,以期为江淮官话未来的研究提供借鉴。

1 数据来源与研究工具

1.1 数据来源

皖属江淮分水岭地区的方言主要为江淮官话,因此检索数据库采用如下检索策略:((主题%=′江淮官话′or题名%=′江淮官话′or title=xls(′江淮官话′)or v_subject=xls(′江淮官话′))OR(主题%=′江淮分水岭方言′or 题名%=′江淮分水岭方言′or title=xls(′江淮分水岭方言′)or v_subject=xls(′江淮分水岭方言′)))AND(发表时间 Between(′2011-01-01′,′2020-12-31′))。检索范围为CNKI总库。时间跨度为2011—2020年。数据纳入标准为江淮官话或者江淮分水岭方言相关研究的文献,不论何种研究类型,发表语言为中文。排除标准为期刊约稿、会议通知,或重复发表、作者关键词等信息不全的文献。通过检索得到543篇文献,排除不符合纳入标准的文章后,共获得458篇文献。

1.2 研究工具

将文献导入CiteSpace5.7.R5软件进行数据转换。时间分区选2011和2020为研究起止时间,时间切片以每1年为1个时间切片。节点类型分别选择作者、机构、关键词绘制和知识图谱。数据筛选策略为两种数据筛选策略的配合使用,每个时区中选择前50个高频出现的节点(Top 50 per slice),同时将前、中、后三个时间段的出现频次、共现频次、共现率(c,cc,ccv)设置为2、2、20。图谱修剪方式选择寻径(Pathfinder)以简化节点网络并突出其重要的结构特征。

2 结果与分析

2.1 研究年份与研究作者、研究机构合作分析

根据发表年度及篇数文献进行分析可知,年均发文量45.8篇,其中2014年和2017年发文量最多,分别有70篇和68篇,从总体趋势上来看,年发文量在平均值上下波动,研究趋势较为稳定。将2011—2020年相关文献导入CiteSpace信息可视化分析软件后,生成江淮官话研究作者和机构合作共现视图,共现图上共有258个节点,但却仅有37条连接线,节点密度仅为0.001 1。字号较大且周边连接线较粗的节点图上仅有四个,分别为周政、冯法强、冯青青和顾劲松等四位研究者及其所在研究机构。节点机构字号越大,说明该机构总体出现频次越高。连接线表示机构间存在合作,连接线越粗,共现频次就越高,意味着作者及其所在机构在研究领域的学术影响力越强[2]75。研究者与机构合作共现图谱分析结果显示,目前周政、冯法强、冯青青和顾劲松等四位研究者以及安康学院、盐城师范学院、南开大学和常熟理工学院等四所研究机构在江淮官话研究领域内的学术影响力最显著,但总体而言,连接线很少,说明各机构和研究者之间合作很少,具备显著学术影响力的研究机构和研究者并不多。通过对四位研究者发表的相关文献进行总结,结果显示方言之间的差异和融合一直是研究的中心议题。周政主要研究的是安康方言中江淮官话的地理分布、历史成因以及安康地区中原官话、西南官话和江淮官话等方言片之间的差异和融合[3-5]。冯法强的主要研究内容是近代江淮官话语音演变研究[6],并对江淮官话的擦化音变、开口化音变、元音鼻化和元音链移进行了专项研究[7]。冯青青和顾劲松的主要研究内容是苏北地区声母、韵母、声调的读音类型和演变过程以及苏北江淮官话的地理语言学,发现泗洪、盐城、涟水等苏北方言具备江淮官话的典型特征[8-12]。

2.2 关键词共现聚类分析

关键词反映文献的核心内容和关键信息[13],关键词共现分析是基于文献关键词出现次数进行的分析,从而得出关键词的频次(Freq)、Burst值、中心性(Centrality)和Sigma值等信息。在此基础上,通过谱聚类算法生成知识聚类,再用算法从引用聚类的相关施引文献中提取标签词,生成自动聚类标签视图。关键词共现聚类分析在一定程度上可归纳出某一研究领域的研究热点分布和趋势[2]76。

表1给出了排在前10的关键词的频次、Burst值、中心性和Sigma值等详细信息。中心性在一定程度上显示节点间的关联性及其在网络中的地位,中心性越高,表明其引用率越高、相关研究越多,若节点的中心性>0.1,则认为该节点具有较重要位置[2]82,往往位于两个聚类的边缘,代表研究领域内出现开创性发现[14]。基于中心性和突现性计算得到Sigma值,节点的中心性和突现性越高,其Sigma值也越高。Burst值表明关键词在某一时间区间里受到研究者的关注度,Burst值高的关键词在一定程度上代表了江淮官话研究在相应时间区间内的研究热点[2]137。

表1显示,依据中心性的大小,具有重要位置的关键词节点依次为江淮官话、演变、语音、方言、入声和中原官话。综合考虑关键词的频次和中心性,即依据Sigma值的大小,排在前10的关键词依次为江淮官话、演变、语音、方言、入声、中原官话、比较、西南官话、吴语和历史层次。Burst值最高的三个关键词为语音、词汇和西南官话。

表1 高频关键词节点信息详细列表

图1是根据对数似然率(LLR聚类算法)生成的关键词自动聚类标签视图,共有314个节点,412条连线,圆环代表关键词的节点,节点的大小与该节点的出现频次正相关。节点内圈中的颜色表示不同时间段,冷暖色调的变化表示时间从早期到近期的变化,厚薄度则表示关键词出现频次。节点之间的连线表示关键词共现关系,其粗细程度表示共现的强度。关键词自动聚类标签视图从宏观上展示了江淮官话研究热点分布。排在前10的关键词聚类依次为#0江淮官话、#1入声、#2方言、#3词汇、#4西南官话、#5丹阳方言、#6地理分布、#7九江方言、#9音变和#10《无声反切正韵》。

图1 基于LLR算法的江淮官话研究关键词共现聚类图

结合考虑以上信息,可知江淮官话研究热点为江淮官话的历史演变、语音研究尤其是入声研究以及与其他方言的比较研究。江淮官话与其他方言的比较研究目前主要的研究成果集中在江淮官话与中原官话的比较研究方面,而在与西南官话与吴语的比较研究方面学术影响力尚显不足。表1显示,词汇研究的Burst值为3.17,Sigma值为1.06,说明江淮官话词汇研究在某一时间区间内迅速获得研究者的广泛关注,但其中心性仅为0.02,说明研究者和研究机构之间缺乏合作,学术影响力并不显著。

2.3 突现词分析

突现词指在较短时间内使用频次较高的词汇,其出现和消失时间一定程度上可判断该领域前沿热点,预测研究趋势[15]。图2为突现词分析视图,突现强度(strength)排名前九的突现词以出现年份先后排序,深色色块表示突现词的突现起止年份,这些突现词代表某一时期内江淮官话的研究热点。图2显示,2011—2014年研究热点集中在江淮官话的语音、词汇、归属及方言间的比较等方面,2013—2016年研究热点集中在西南官话,2014—2016年研究热点集中在地理分布,2017—2020年研究热点集中在音系研究,2018—2020年研究热点集中在共时研究和吴语。因此,江淮官话语音研究的发展分2011—2014年和2017—2020年两个时期,在同时期的研究热点中,突现强度最高。这说明语音研究是江淮官话研究最重要的部分,研究成果最丰硕,研究的传承性较好,早期语音研究侧重研究所有语音的自然属性;而后期语音研究则侧重音系研究,研究者主要关注江淮官话中某一特定语言的语音系统,聚焦于语音的社会属性。与语音研究相比,词汇研究的强度虽然较高,但在2014年之后,突现强度迅速衰减,这说明词汇研究虽然在2011—2014年间受到研究者的关注,但研究的传承性较差,亟需新理论或研究工具等进一步深化江淮官话的词汇研究。在江淮官话的归属和比较研究方面,2013—2016年研究者关注的是江淮官话与西南官话的比较研究,而2018—2020年则聚焦于江淮官话与吴语的比较研究,同时,在2018—2020年这一时期共时研究成为热门研究角度。综上所述,突现词分析结果显示江淮官话的音系研究、共时研究以及与吴语的比较研究可能是江淮官话研究的未来发展趋势。

图2 江淮官话研究的排名前9个突现词分析视图

2.4 时间线视图分析

在对默认视图完成自动聚类标签的基础上,以聚类标签为纵轴,以时间为横轴,同一聚类的关键词节点按时间先后顺序排布在同一时间线上,生成时间线视图,如图3所示。时间线视图侧重于勾画聚类之间的关系和各聚类中关键词的历史跨度[2]76。

图3 基于LSI算法的江淮官话研究时间线视图

图3为按照Latent Semantic Index(LSI)算法自动生成聚类标签的江淮官话关键词时间线视图,聚类模块值(Q值)为0.879 3,划分的社团结构是显著的,平均轮廓值(S值)为0.957 4,聚类是高效率令人信服的。纵轴上按照大小排在前10位的聚类代表江淮官话研究热点领域,分别是#0江淮官话、#1入声、#2语音、#3中原官话、#4官话方言、#5演变、#6入声韵、#7方言、#8比较研究和#9语言接触。这个结果与LLR算法得出的结论基本一致的。

组成聚类的主要关键词在图上以十字架为标记,按出现先后顺序从左到右排列在时间横轴上,节点的大小与该节点的频次正相关,时间线的下方列出三个高频关键词,频次最高的关键词排在最下面。从节点分布来看,具有重要地位的关键词节点在2011—2012年这一时期集中出现,由此可见,这一时期是江淮官话研究的高峰期,研究成果主要集中在入声、韵母、声调、“儿化”、吴语、语音、中原官话、演变、词汇和方言等研究热点。

时间线的长度代表聚类的历史跨度。图3显示,#0江淮官话、#3中原官话和#8比较研究等三个聚类的历史跨度长达10年,直到2020年聚类仍然是活跃的。#1入声、#5演变、#6入声韵和#10九江方言等四个聚类历史跨度达到9年,但2018年后活跃度下降。#2语音聚类2015年之前时间横轴上列出12个关键词,2016年之后节点减少,2017年后节点消失,说明语音研究在2015年之前一直是江淮官话研究的热点,2017年之后关注度下降,但并不意味着研究停滞,从图3中可以看出,语音研究以多种形式活跃在其他聚类中,如#0江淮官话聚类的入声感知、#9语言接触聚类中的入声音节和语音变异、#13音变聚类中的元音链移等关键词。#18地理语言学聚类的历史跨度只有1年,但聚类中吴语节点较活跃,因此吴语可能成为未来江淮官话研究的前沿热点。

3 结 语

江淮官话研究趋势较为稳定,尽管2014年和2017年发文量最多,但具有显著学术影响力的研究成果主要集中在2011年和2012年,因此2011—2012年是江淮官话研究的高峰期。江淮官话研究热点领域主要集中在江淮官话的历史演变研究、语音研究、入声研究以及与其他方言的比较研究。语音研究大致可分为2011—2014和2017—2020两个阶段,2014年前侧重研究所有语音的自然属性,2015年之后关注度下降,但语音研究并未停滞,2017年之后侧重音系研究。入声研究中,韵母、声调、时长和发声态是热点主题。2016年之前研究者关注的是江淮官话与中原官话、西南官话的比较研究,2018年之后研究者开始关注江淮官话与吴语或苏北方言的比较研究。综合考虑突现词分析和时间性视图,江淮官话的音系研究、共时研究以及与吴语的比较研究可能是江淮官话未来的研究趋势。

从文献增长速度和研究者之间的分布来看,江淮官话文献的增长速度较慢,研究机构和研究者之间缺乏合作,尚未产生具备一定学术影响力的标志性研究者和研究机构。从研究内容来看,江淮官话的词汇研究和语法研究发展相对滞后,发展动力不足,缺乏实证研究。在未来的发展中,应当加强研究者和研究机构之间的合作,推动江淮官话词汇、语法和应用研究的长足发展。

猜你喜欢
官话视图热点
热点
热点
结合热点做演讲
5.3 视图与投影
视图
Y—20重型运输机多视图
SA2型76毫米车载高炮多视图
热点
征集官话易祛除官话难
俗话说,官话说