我国人文社会科学领域学者性别结构研究

2023-10-08 00:09逯万辉
关键词:社会科学学者人文

逯万辉,田 丰

一、 引 言

一直以来,性别差异问题受到社会各界的广泛关注。在科学学和科学社会学领域,针对科学工作者性别差异问题的研究近年来也在持续升温,特别是对有关科研工作者队伍中的性别结构与规模、不同性别的学术产出与影响、学术合作的性别倾向等一系列问题,国内外众多学者展开了大量研究并产出了较为丰硕的研究成果。如科尔(1)COLE J R. The productivity puzzle: persistence and change in patterns of publication of men and women scientists[G]//Advances in motivation and achievement: a research annual women in science. London: Jai Press Inc, 1984(2): 217-258.等学者于1984年提出的“学术产出之谜”(The Productivity Puzzle),指出女性科研人员的科研成果数量与被引次数明显低于男性,且年龄越大,差距越大的现象。虽然近年来女性科学家受到关注,但是这类问题仍然存在。Larivière等(2)LARIVIRE V, NI C, GINGRAS Y, etc. Bibliometrics: global gender disparities in science[J]. Nature, 2013(504): 211-213.基于Web of Science数据库中的近550万篇论文为数据源,绘制了全球30个国家(或地区)的论文产出者的性别分布情况,结果显示绝大多数国家(或地区)均是男性作者占主导地位。Giuliana(3)GIULIANA V. Are women publishing less during the pandemic? Here’s what the data say[J]. Nature, 2020(7809): 365-366.使用预印本平台对新冠疫情期间的发文情况研究发现,与新冠疫情期间的男性同龄人相比,女性学者发表的预印本数量与启动的研究项目更少。在性别差异与学术影响力方面,有学者采用科研论文的被引量指标来衡量不同性别的学术影响与差异,但是该研究结果目前仍存在一定的争议(4)BROWN N E, SAMUELS D. Beyond the gender citation gap: comments on Dion, Sumner, and Mitchell[J]. Political analysis, 2018(3): 328-330.(5)NIELSEN M W. Gender and citation impact in management research[J]. Journal of informetrics, 2017(4): 1213-1228.。随着科学社会学研究的不断深入,科研产出的性别差异研究也在不断深化,学者们进一步研究并证实了科学领域学术合作网络结构和学术合作对象选择中存在的性别差异现象(6)朱依娜, 何光喜. 学术产出的性别差异:一个社会网络分析的视角[J]. 社会, 2016(4): 76-102.,并且也有研究表明性别和年龄等个体因素对跨学科科研合作的开展也存在显著影响(7)傅锐杰. 研究型大学教师跨学科科研合作及影响因素研究——以Z大学为例[D].杭州: 浙江大学,2022.。与此同时,科研产出的性别差异问题研究的数据基础也从科研论文数据向专利数据扩展,呈现出多源数据融合特征,分析维度和研究视野也在不断拓展。如Melo-Martín(8)MELO-MARTN D I. Patenting and the gender gap: should women be encouraged to patent more?[J]. Science and engineering ethics, 2012(2): 491-504.从专利产出的社会效益出发,探讨了不同性别科研工作者的专利产出差异及科研创新激励机制问题;王宇开等(9)王宇开, 杨中楷, 王贤文, 等. 专利发明人合作存在性别偏好吗?[J]. 科学学研究, 2021(3): 415-422.对专利发明人合作中的性别偏好问题进行了深入研究,结果表明发明人团队中广泛存在“同质性”合作偏好现象,且女性处于绝对劣势地位。至于为什么会出现这种科研成果产出的性别差异问题,崔林蔚(10)崔林蔚. 科研人员科研产出及影响力性别分层的研究进展[J]. 科学学研究, 2021(7):1239-1247.通过对现有研究成果的梳理,从科学社会学视角对造成该现象的影响因素进行了归纳,总结概括为智力因素、个人选择及社会选择等三个方面的十余个因素。

从已有研究成果来看,当前有关科研人员性别差异问题的研究范畴仍主要集中在科学技术领域,研究对象以自然科学领域和工程技术领域的科研人员为主。据统计,我国已拥有超过1 400万女性科技工作者,占整个科研队伍的40%(11)王瑛. 唤醒女性研究人员的科技领导力[J]. 科技导报, 2012(12):11.,庞大的群体数量及知识精英阶层身份,使得对女性科技工作者群体的发展现状和成长规律给予足够的研究和关注成了十分必然和迫切的事情(12)李媛. 我国女性科技工作者成长过程探析及启示[J]. 中国科学基金, 2013(5): 274-277.。在此背景下,2021年6月,科技部等十三部门联合印发《关于支持女性科技人才在科技创新中发挥更大作用的若干措施》的通知,对于进一步激发女性科技人才创新活力,推动创新驱动发展战略走向深入,实现我国科技事业高质量发展具有重要作用。与此同时,在“加快构建中国特色哲学社会科学”的大背景下,摸清我国人文社会科学领域科研人员的性别结构和规模,研究不同性别特征人文社会科学工作者的成长规律与发展现状,探索性别差异背后的影响因素与作用机理,进而制定科学合理的科研管理政策与人才培养方案,对于激发人文社会科学领域工作者的科研活力,助推我国哲学社会科学事业高质量发展具有重要意义。

二、 数据与方法

本研究数据来源于中国社会科学评价研究院建设的中国人文社会科学期刊引文数据库(CHSSCD),以其中收录的学术质量相对较高的580种核心及以上级别期刊于1999—2020年间刊载的190万余篇学术论文所涉及的约295万名学者记录为统计样本。之所以采用学者记录数进行统计分析,是由于本文的研究目标是进行学者性别结构和科研产出差异分析。从研究目标的实际需要出发,可发现在数据层面的学者和发文数据间存在多对多关系,且有学者重名现象,因此通过学者记录数进行科研成果分配,可以较为准确地计算和反映性别产出差异,并为后续不同性别的合作偏好研究提供基础元素。

在上述约295万余名学者记录中,有性别标记的学者记录条数为89.2万条,占比30.28%,为进一步准确识别未被标记性别属性的剩余205.4万条学者记录,本文采用规则和统计相结合的方法进行学者性别识别工作。性别识别工作主要包含以下三个步骤:收集数据并构建姓名—性别映射关系,匹配补齐部分姓名的性别属性;采用机器学习中的朴素贝叶斯(Naive Bayes)算法进行姓名—性别关系预测,识别姓名性别分类;对基于朴素贝叶斯算法的姓名性别分类效果进行评估,计算分类效果的准确性及采用该方法进行后续研究存在误差的合理性。

(1) 姓名—性别映射关系构建与姓名的性别属性补齐。通过上述数据样本中学者信息的抽取与统计分析(如下页表1所示),在有性别标注的892 133名学者记录中,经去重处理后可以准确地分离出129 885个男性姓名和89 912个女性姓名,另有10 180个姓名的性别存在歧义性。在所有姓名中性别歧义的姓名占比仅为4.43%,即在现有命名规则下,95.57%的姓名能够有明确的性别指向。

表1 学者姓名—性别映射情况

(2) 将上述能够准确表达姓名—性别关系的129 885个男性姓名和89 912个女性姓名所构成的姓名—性别映射词典应用于数据集中未被标记性别属性的205万余条学者记录中,进行学者姓名匹配与性别补全。基于该规则匹配后,有1 133 540条记录被准确匹配并标记性别,结合原始记录中带有性别标记的记录,统计数据源中68.76%的记录数据已准确匹配学者性别信息,但仍有31.24%的记录未能识别学者性别(如表2所示)。

表2 基于姓名—性别词典匹配的学者性别信息识别结果

(3) 鉴于机器学习中的贝叶斯分类算法的易用性及其在性别分类研究中的广泛应用(13)蒋才智, 王浩, 姚宏亮. 基于知网的贝叶斯中文人名识别[J]. 南京大学学报(自然科学版), 2012(2): 147-153.,本文采用朴素贝叶斯算法,对未能识别到匹配性别的学者姓名记录进行计算,预测学者性别。贝叶斯分类算法的计算公式如下(14)VERGARA D, HERNNDEZ S, JORQUERA F. Multinomial Naive Bayes for real-time gender recog-nition[EB/OL].(2016-11-17)[2023-09-01]. https://ieeexplore.ieee.org/document/7743331/citations#citations.:

公式中参数的定义如下:Gmale表示男性,namei表示姓名,在给定训练集上,通过计算不同性别下姓名的用词规则预测未匹配性别的姓名性别概率为P(Gmale|namei),如果P(Gmale|namei)>0.5,则为男性,反之则为女性。

基于该方法,对上述未标记性别记录的920 260条数据的作者姓名进行性别分类,其中成功进行性别分类的记录数为897 917条(占未分类数据的比例为97.57%),其中以“机构名”“课题组”等形式出现的论文所有者信息未被标记性别属性。具体的数据标注结果情况如表3所示。

表3 基于贝叶斯算法的学者性别分类结果

由于贝叶斯算法预测性别会存在一定的误差,因此需要对结果的有效性进行评估。经测试,基于贝叶斯算法的性别识别方法的准确率(Accuracy)为89.53%。从整个数据源来看,最多有3.19%即(1-89.53%)*897917/2945933的性别标注可能存在性别分类错误,占比相对较低,对整体的影响不大。即在基于本文样本数据集的性别结构研究中,至少96.81%的性别数据是准确的,基于该数据集的研究结果也可以解释为在95%的置信区间内是可信的。

三、 我国人文社会科学领域学者性别结构特征分析

(一) 整体规模与性别结构分析

为了摸清我国人文社会科学领域学者队伍规模与性别结构,在上文学者性别属性分类标注的基础上,对标注性别特征的2 923 590条学者记录进行统计分析后可以发现,在我国人文科学领域,男性学者占全部学者的比例约为64.19%,女性学者占比约为35.81%。

从整体上来看,这一结果远低于自然科学和工程科学领域的学者规模,其中女性学者的比例也低于科技领域。从科研产出的整体情况来看,如表4所示,男性学者人均(参与)发表论文5.96篇,女性学者人均(参与)发表论文4.78篇,男性学者的发文量整体远高于女性学者,占全部发文量的69.08%,女性学者发文量占全部发文量的比例为30.92%。

表4 我国人文社会科学领域学者整体结构

从历年数据情况来看,我国人文社会科学领域女性学者所占比例在不断上升,从1999年女性学者占全部学者的比例为24.09%上升到2017年的38.06%,提升了近14个百分点。近年来该比例虽然有所下降,但依然维持在35%以上,男性学者所占比例则在随之减小。可见女性学者的规模在不断扩大,女性学者与男性学者在科研产出上差距也在不断缩小,如图1所示。

图1 1999—2020年我国人文社会科学领域学者性别结构演变

(二) 不同学科学者性别结构分析

此前,不同学科领域的性别差异问题已有学者进行了深入研究,结果表明男性与女性在不同学科间的优势与差别是显著存在的(15)王会景. 研究生网络信息获取行为的差异研究[D]. 保定: 河北大学, 2016.。从这个角度出发,探讨在我国人文社会科学领域内部不同学科之间,是否存在学者性别结构与科研产出之间的显著性差异,是本节重点研究和回答的问题。

图2展示了我国人文社会科学领域不同学科学者的性别比例情况。从结果来看,考古文博学科中男性学者占比最高,达74.17%,女性占比仅为25.83%,男女比约为3∶1。这可能与考古学的学科特点有关,男性学者对于长期进行田野调查、作业可能更为适应,从发文情况来看,考古文博学科男性学者发文占全部发文记录的80.08%,远高于女性学者参与的发文记录。其次是马克思主义学科和历史学科,两学科男性学者占比分别为72.68%和72.38%,法学、宗教学等学科领域中女性学者的占比也都低于30%。在心理学领域,男性学者占比为51.74%,女性学者占比48.26%,性别比例基本达到均衡状态。在图书情报与档案学、语言学、艺术学、教育学和新闻传播学等领域,女性学者的占比均高于40%,这些学科女性学者的参与程度和科研产出均高于平均水平。

图2 我国人文社会科学领域不同学科学者性别结构

四、 我国人文社会科学领域学者合作的性别偏好分析

(一) 不同性别学术合作的整体分析

学术交流与合作是促进科研产出的重要途径,良好的学术交流与合作能够在优势资源互补的基础上,拓展研究思路,开阔研究视角,推动学术创新。在我国人文社会科学领域的学术产出中,合著科研成果比例也在不断上升,学术合作已成为促进学术创新的一个重要途径(16)郝若扬, 逯万辉. 我国人文社会科学学术合作特征演变研究[J]. 情报杂志, 2018(6): 124-132.。目前该领域已有大量的研究成果,但是从性别的角度来研究学术合作,特别是回答我国人文社会科学领域学者间的跨性别合作情况,还鲜有量化的数据支撑。

为确定我国人文社会科学领域学者合作的性别倾向,研究其中是否存在性别偏好现象,本文对上述数据源中的学者信息和学术合作情况进行挖掘,进而对比分析我国人文社会科学领域学者合作过程中男性主导的学术合作与女性主导的学术合作间存在的性别差异。在有关学术合作主导的界定上,已有学者对科研合著中署名顺序与作者贡献进行了系统深入的研究,本文在其基础上采用第一作者作为主导作者进行学术合作团队划分(17)左菊. 科研合著中署名顺序与作者贡献研究[D]. 重庆: 西南大学, 2014.。

基于上述思路和方法,本研究对我国人文社会科学领域1999—2020年的2 923 590条学者记录进行整合,从合作的视角来测算论文的合作产出情况,其中涉及学术论文1 872 273篇,有两个及以上学者合作产出的论文692 709篇,占比约为37%。在合作论文中,第一作者为男性的学术论文有473 097篇,占合著论文的比例约为68.3%,女性学者作为第一作者的论文比例为31.7%。该结果表明,在我国人文社会科学领域的学术合作中,男性学者在其中起到主导作用如表5所示。

表5 我国人文社会科学领域合作产出与性别主导情况

(二) 不同性别学术合作的时序演变与学科差异

从统计数据来看,我国人文社会科学领域核心期刊论文中学术合作发表是当前学术研究中的一大趋势,在过去二十多年间,合作论文占比从1999年的21.19%上升到2020年的46.83%,增长了约2.2倍。在这些合著论文中,男性作为第一作者主导发表的学术论文占全部合作论文的比例为68.3%,但是这一数据基本呈现出下降趋势,从20世纪末的78.86%下降到2017年的62.63%,下降约17个百分点。近年来这一比例又略微有所上升,随之女性作为第一作者主导发表的合著论文比例持续上升。从整体上来看,男性仍然是学术合作中的主导力量,但女性在合作中的主导权也在不断上升(如图3所示)。

图3 1999—2020年合作论文比及男性与女性主导的合作论文分布

从各学科学术合作情况来看,环境科学的学术论文合作最为普遍,学术合作率高达88.45%,其次是心理学,合作率为88.06%。文学学科的学术合作率最低,仅为9.98%。这也表明不同学科间学术产出的主要特点。从学术合作的性别主导情况来看,考古文博学科的学术合作中,男性主导发表的合作论文占比高达81.16%,呈现绝对主导地位,其次是法学、历史学、宗教学、马克思主义学科等,虽然这些整体学术合作率不高,在为数不多的学术合作中,也仍然是以男性学者为主导,男性主导的学术合作占比均在74%以上。图书情报学与心理学的学术合作中,男性与女性主导的学术合作比例相对比较均衡,女性主导的学术合作论文占比均在40%以上。具体如图4所示。

图4 各学科合作论文比及男性与女性主导的合作论文分布

(三) 不同性别学术合作的性别偏好

在我国人文社会科学领域的学术合作过程中,不同性别学者在选择合作对象过程中是否存在自然科学和工程技术领域中的性别偏好情况?是否有男性更愿意与男性合作、女性更愿意与女性合作的“合作同质化”现象?这是本节重点研究和解答的问题。

从上文数据可以看到,学术合作产出比例在过去二十多年里一直在持续上升,学术合作已成为促进学术产出的重要形式。在合作形式上,男性主导的学术合作占比在不断下降,女性主导的学术合作在不断提升,但是进一步从合作团队的内部构成来看,男性主导的学术合作中,有女性参与的团队比例为41.67%,而在女性主导的学术合作中,有男性参与的合作团队的比例高达74.14%。单从数据来看,男性参与学术合作的机会要高于女性,即不论是男性主导的学术合作还是女性主导的学术合作,似乎在合作团队组建中都更倾向于选择男性合作对象,且女性主导的学术合作团队更甚。

为了更好地观测男性主导的合作团队与女性主导的合作团队的性别偏好程度,本文采用下列公式进行历年学术合作团队的性别偏好差异程度测算(18)DE MELO-MARTN I. Patenting and the gender gap: should women be encouraged to patent more?[J]. Science and engineering ethics, 2012(2): 491-504.:

上式中,valueyear为学术合作团队的性别偏好差异比,Femalefemale-leading代表女性主导合作中的女性参与人数,Femalemale-leading代表男性主导合作中的女性参与人数。

分析男性主导的学术合作与女性主导学术合作中的女性参与人对比结果如图5所示。从数量来看,在过去二十多年里,女性学者参与学术合作的整体数量在不断增加,即不论是女性主导的学术合作还是男性学者主导的学术合作中女性学者的参数数量都在增加,但是女性学者在男性学者主导的学术合作中的参与程度在不断降低。基于上述公式计算出的year-value值从1999年的0.04上升至2017年的最高0.25,近年来该值虽然有所降低,但是在过去二十多年一直为正数,这也表明男性主导的学术合作中,女性的参与人数一直都低于女性主导的学术合作。结合前文数据,男性主导的学术合作占全部合作团队的68%以上,且男性主导的学术合作团队中,平均每个团队中女性学者的参与人数约为0.49人次,而女性主导的学术合作团队中,平均每个团队中女性学者的参与人数为1.51人次,这也意味着女性学者并未更多地进入到当前的学术交流与合作中。也就是说,男性主导的学术合作团队更愿意与男性展开合作,而女性参与的学术合作,则主要集中在女性主导的学术合作团队中。由此推断,造成女性团队中女性合作者人数不断增加的原因可能是被动选择的结果,至于其中的深层次原因,还有待微观层面加以更加深入的研究和分析。

图5 历年学术合作团队中女性参与人数及差异情况

五、 研究结论与讨论

基于上述分析结果,本文可以总结出以下几点结论:

1. 在我国人文社会科学领域,男性学者仍处于核心位置,但部分学科女性学者占比远高于自然科学和工程技术领域。

从绝对数据来看,在我国人文社会科学领域的核心期刊论文发表上,男性学者占比约为64.19%,女性学者占比35.81%,其中男性学者参与发表的核心期刊论文数量占全部发文量的69.08%,人均(参与)发表论文5.96篇,高于女性学者的4.78篇。从这个性别分布格局来看,人文社会科学领域的女性占比要高于女性在自然科学领域的占比。从我国人文社会科学内部的各学科差异情况来看,考古文博学科中男性学者占比最高,达74.17%,女性占比仅为25.83%,男女比例约为3∶1。其次是马克思主义学科和历史学科,该学科男性学者占比分别为72.68%和72.38%,法学、宗教学等学科领域中女性学者的占比也都低于30%。在心理学领域,男性学者占比为51.74%,女性学者占比48.26%,男女学者比例基本达到均衡状态,在图书情报与档案学、语言学、艺术学、教育学和新闻传播学等领域中,女性学者的占比均高于40%,这些学科女性学者的参与程度和科研产出均高于平均水平。

2. 在我国人文社会科学领域,男性在学术合作中起主导作用,且男性参与学术合作的机会远高于女性,不论是男性主导的学术合作还是女性主导的学术合作,都更倾向于选择男性合作对象。

在我国人文社会科学领域的学术合作论文中,第一作者为男性的学术论文占合著论文的比例约为68.3%,女性学者作为第一作者的论文比例为31.7%,整体来看男性在我国人文社会科学领域的学术合作中起到主导作用,但是各学科之间也存在差异,如图书情报学与心理学的学术合作中,男性与女性主导的学术合作比例相对较为均衡,女性主导的学术合作论文占比均在40%以上。在学术合作团队内部,男性主导的学术合作中有女性参与的团队比例为41.67%,而在女性主导的学术合作中,有男性参与的合作团队的比例高达74.14%,男性参与学术合作的机会要高于女性。

3. 在我国人文社会科学领域学术合作团队的内部结构上,女性学者数量虽然在不断增加,但是仍存在较为明显的男男合作与女女合作现象。

在我国人文社会科学领域的学术合作团队结构上,男性主导的学术合作中女性的参与人数一直都低于女性主导的学术合作中女性的参与人数,这也表明在占据全部合作团队68%以上的男性学术合作团队中,女性学者并未更多地进入到当前的学术交流与合作中。在男性主导的学术合作团队中,平均每个团队中女性学者的参与人数约为0.49人次,而女性主导的学术合作团队中,平均每个团队中女性学者的参与人数为1.51人次。女性参与的学术合作主要集中在女性主导的学术合作团队中,造成女性团队中女性合作者人数不断增加的原因可能是被动选择的结果,至于其中的深层次原因,还有待从微观层面加以更为深入的研究和分析。后续仍需要加强跨学科科研合作视角的研究分析工作,进一步研究探讨不同性别、年龄等个体因素和交流途径、交流机会等组织因素对开展跨学科科研合作的影响,进而为实现跨学科科研合作对象的精准选择提供更加丰富的研究方法,为推动跨学科研究成果质量的有效提升和知识创新能力水平的高质量发展提供更加多元的研究视角。

从女性科研工作者整体教育背景和成长经历来看,我国女性在受教育阶段整体比例要高于男性,根据教育部公布的各级各类学校女学生占比统计数据显示,近年来我国受高等教育(本科、研究生)的女生比例持续增加,如2019年我国在校本科学生中女生占比59.90%,女研究生占研究生总数的50.56%,其中女博士占41.32%,女硕士占52.17%(19)周韵曦.女大学教师数量及占比持续增长[N].中国妇女报,2020-06-16(1).。但是从女性科研工作者的职业生涯发展来看,由性别导致的职业生涯累计时长仍然存在较大差异,研究表明男性科研工作者的平均职业生涯为11年,而女性的平均职业生涯只有9.3年,男性在时长上的优势达到16%(20)HUANG J, GATES A J, SINATRA R, etc. Historical comparison of gender inequality in scientific careers across countries and disciplines[J]. Pans, 2020(9): 4609-4616.,这也可能是影响女性科研工作者成就的主要因素。这在现实中的表现就是女性科研工作者学术成果产出量整体上低于男性,究其原因,可能在于女性科研人员过高的“退出率”造成了学术界这种性别差异现象,即女性科研人员由于各种原因过早地离开了学术研究一线,而该现象目前已引起学术界和科研管理部门的高度重视。基于此,从2011年开始,国家自然科学基金委将女性科研工作者申请青年科学基金的年龄上限从35岁提高到40岁,而男性的年龄限制则维持在35岁不变。放宽女性申请人的年龄限制之后,女性获批者比例在一年内上升了10%,可见这一举措有效激发和延长了女性科研工作者的学术活力。鉴于女性学者在我国人文社会科学研究领域的规模与比重在不断扩大,且该比例在部分学科远高于自然科学与工程技术领域,庞大的数量结构与知识精英身份,成为当前学术界和科研管理部门高度关注的重要方面。但是受传统社会观念等因素影响,女性学者往往因承担着相对较多的生育与家庭责任而使科研受限。因此在人文社会科学领域的科研管理与人才队伍建设方面,需要更加注重管理的弹性,在保障女性科研工作者的基本权益的同时,更大限度地激发和释放女性科研工作者的创新活力,充分发挥女性科研工作者在整个学术创新系统中的作用。同时由于女性受到生育等各方面因素影响,相较于男性学者,在职业发展与个人成长道路上的规律也必然存在一定的差异。因此,有必要从国家层面上加快推进我国人文社会科学科研人员基础数据库建设,建立科研人员基本信息系统平台,研究不同性别、不同年龄阶段、不同学科领域、不同学术合作模式等不同条件下的科研产出规律和学术研究状态,深入挖掘客观现象背后的影响因素和作用机理,不断加深对我国科研人才成长成才过程的规律性认识,为精准制定科研管理政策和人才培养方案提供理论支撑,为科研人才成长努力提供良好的政策环境和制度条件,进而为推动我国哲学社会科学科学研究事业高质量发展提供坚实的人才基础。

猜你喜欢
社会科学学者人文
人文
学者介绍
学者简介
《云南社会科学》征稿征订启事
学者介绍
《河北农业大学(社会科学版)》2021年喜报
人文绍兴
学者介绍
人文社科
数学在社会科学中的应用