FI与AI：评价体育科学研究者学术积累的新方法

2020-11-10 14:54张力为李丹阳杨红英

上海体育学院学报 2020年11期

关键词：博导研究者学术

张力为，李丹阳，杨红英

（1.北京体育大学心理学院，北京100084；2.北京体育大学图书馆，北京100084）

1 问题的提出

1.1 常用的学术评价量化指标

在学术领域，常会遇到学术评价问题，包括哪些学术刊物最好，哪些学术机构最好，在特定研究领域哪些研究者最具影响力等。

对于学术刊物的评价，科学家共同体认可度较高的是某一期刊的影响因子（impact factor，IF），其计算公式为：IF=某期刊前2 a发表的论文在该报告年份（JCR year）中被引用总次数/该期刊在这2 a内发表的论文总数。这也是汤森路透（Thomson Reuters）发布的期刊引证报告（Journal Citation Reports，JCR）中的一项重要数据指标。

对于学术机构的评价，科学家共同体认可度较高的是大学排名，包括中国软科世界大学学术排名、英国泰晤士高等教育世界大学排名、英国QS世界大学排名和美国U.S.News世界大学排名等。

对于研究者个人学术影响力的评价，科学家共同体认可度较高的则是H指数，其计算思路是：1名研究者发表的Np篇论文中有h篇每篇至少被引h次，而其余（Np-h）篇论文每篇被引均小于或等于h次。H指数由美国加利福尼亚大学圣地亚哥分校的物理学家乔治·赫希（Jorge Hirsch）在2005年提出，目的是量化科研人员作为独立个体的研究成果。目前，有些大学将H指数作为职称晋升的依据之一，有些国际会议将此作为选拔主题报告人的依据之一。体育图书情报学领域也有研究者［1-9］开始使用H指数系统评价不同体育科学领域研究者的学术影响力。G指数则是H指数的衍生指数，主要为弥补H指数不能很好地反映高被引论文的缺陷而提出，指论文按被引次数排序后相对排序前的累积被引至少G2次的最大论文序次G，即第（G+1）序次论文对应的累积引文数将小于（G+1）2。

本文侧重于在研究者个人学术发展层面，探讨如何弥补H指数和G指数的不足，更加全面地评价研究者个人的学术发展，以推动体育科学研究者关注自身学术积累问题，提高学术研究水平。

1.2 FI和AI的性质与含义

如前所述，H指数可反映单个研究者的学术影响力，并得到广泛关注，但任何指标都不是完美的，H指数也不例外［10］。例如，H指数似乎不能反映研究者学术方向的集中程度和学术积累的深入程度。1名研究者在多个研究领域发文，有可能H指数较高，但研究指向松散，不集中，无积累深度。然而，学术积累对于学术发展至关重要。遗憾的是，中国的研究者对此虽有零星的关注［11-13］，但该问题明显是应得到重视却被忽视了的问题。因此，需要1个量化指标，而不仅是呼吁［11］，以衡量1名研究者在自己研究方向上的集中程度和学术积累的深入程度，并据此鼓励研究者集中精力在相对狭窄的领域做持续、深入的专业探索。为此，本文提出2个量化指标尝试解决如何评价研究者个人学术积累的问题。

第1个指标是核心方向聚焦指数（Focus Index of Core Direction，FI）。计算方法：某研究者所发论文的前n个（n=1，3，5……）关键词累计频数与所发论文总数的比值。反映了1名研究者在其学术研究核心方向上的聚焦程度。该指数可能小于1，也可能大于1。该指数越大，说明该研究者在其学术研究核心方向上的聚焦程度越高，有利于研究程度的深入。显然，对体育科学研究发展而言，这种倾向值得鼓励。

以某运动人体科学研究者为例说明FI的含义。通过中国知网的“期刊—作者”发文检索可查到（2020年1月20日查询），该研究者共发表了89篇论文，前5个关键词分别是：力竭运动（26篇），心肌微损伤（11篇），窦房结（9篇），运动心脏（7篇），基因表达（7篇），因此，该研究者在这一时间节点的FI（5）为：

该指数说明，其论文有67.42%指向了前5个关键词的研究方向，FI可能小于1（如上例），也可能大于1。这是因为，如果某研究者总发文量较少（如5篇），但每篇论文关键词一般为3～8个，其所发论文中前5个关键词的累计频数会大于5。在极端情况下，假如5篇论文使用完全相同的关键词，则FI（5）为：

如果该研究者发表的论文一直使用同样的5个关键词，则FI（5）会一直保持在5，但不会更高。例如：

需要说明的是，FI不反映研究者个人的学术影响力，而只代表研究者个人核心研究方向的聚焦程度。

第2个指标是核心方向积累指数（Accumulation Index of Core Direction，AI）。计算方法：某研究者所发论文前5个关键词累计频数与该研究者所属学术团体的研究者发表论文平均数的比值（学术团体可以是学术组织、研究机构、学校院系、研究生导师团体等）。它反映了1名研究者在其学术研究核心方向上的积累程度。该指数可能小于1，也可能大于1。该指数越大，说明该研究者在其学术研究核心方向上的积累程度越高，这也有利于研究程度的深入。显然，对体育科学研究发展而言，这种倾向也值得鼓励。

之所以选择“某研究者所发论文前5个关键词累计频数”作为AI的分子，有2个原因：①许多学术期刊要求研究者投稿时采用3～8个关键词，5则是其中偏低一点的中间值；②中国知网在作者发文检索中首先展示出的关键词为5个。之所以选择“该研究者所属学术团体的研究者发表论文平均数”作为AI的分母，是因为其可反映该学术团体发文数量的总体情况，从数量上（而不是质量上）反映了该学术团体的学术积累。

本文以4所体育院校的博士生导师（以下简称“博导”）作为体育科学学术团体的代表，计算和展示其FI和AI的整体情况，并据此分析与评价体育学不同专业的学术积累，引发体育科学研究者对学术积累问题的关注，促进体育科学研究的良性发展。

2 研究方法

以北京体育大学、上海体育学院、华东师范大学体育与健康学院和北京师范大学体育与运动学院4所体育院校的博导为目的性抽样样本，以FI和AI为计算和表达方法，分析和讨论体育科学研究者的学术发展和积累情况。选择上述4所体育院校的理由是：①其博导（包括外聘导师）的学术水平基本可代表国内体育科学领域研究者的整体水平；②其博导的数量占整个体育科学领域博导数量的比重较大。对193位博导发文情况的统计分析均采用如下步骤。

第1步，在上述4所院校的官网查询2020年博导名单，得到198人。删去在不同学校、不同专业均有招生而重复登记的5人，得到193人，纳入后续的查询、统计和分析。

第2步，本文第一作者分别与上述4所院校的1名资深博导或人事处工作人员通过电话，一一核实该院校博导过去是否还有其他任职单位并进行记录，作为第3步查询时输入多个作者单位的依据。

第3步，在中国知网通过“作者发文检索”对话框，输入作者姓名（精确）、单位（博导单位前4个字，模糊），其中多个单位的博导把所有相关单位一一列出，进行高级检索，得到该博导发表论文的总数。选择该博导的全部论文，点击“导出/参考文献”，文献导出字段为“自定义”，选取“SrcDatabase-来源库”“Title-题名”“Author-作者”“Organ-单位”“Source-文献来源”和“Keyword-关键词”等信息，导出格式为Excel文件。同理，在万方数据知识服务平台上选择“期刊”下的“高级检索”，继而选择“作者发文检索”对话框，在“作者”处输入博导姓名，在“作者单位”处输入其单位（前4个字，模糊），其中多个单位的博导把所有相关单位一一列出，得到在万方数据库中该博导发表论文的总数。选择该博导的全部论文，点击“批量导出”，文献的导出字段为“自定义格式”，已选类型及字段需包含“篇名”“作者”“作者单位”“出处”“关键词”等信息，最后点击“导出到Excel”。

第4步，将分别从中国知网和万方数据库中导出的2个Excel文件合并为1个文件，并对文献信息进行去重处理，得到该博导的发文总数和每篇论文的关键词（此时，每篇论文的多个关键词处于1个单元格中）。之后，对该Excel文件中的关键词一列进行分列处理，使每篇论文的每个关键词处于1个单元格中。

第5步，对关键词进行计数操作，具体为：将所有关键词粘贴到一列，并使用COUNTIF函数对每个关键词出现的频数进行计数，最后对所有关键词出现的频数采用降序（由高到低）显示（在频次相同的情况下，使用专业性关键词代替非专业性关键词，采用宽松标准）。此外，若在同一单位内，出现与该博导同名的人，且通过浏览论文全文无法判断论文作者的情况，则直接询问该博导确定其发文情况。此情况共有6例。

3 研究结果

5个体育学下级学科193名博导中文论文发文情况及FI、AI、百度学术H指数、百度学术G指数情况如表1所示。此外，表2列出了4个重要指数之间的相关系数：①AI与FI的相关性较低，可视为2个指标互相独立，反映的是学术积累的不同方面；②AI与H指数具有中等程度的相关性，说明两者既有联系，又有区别，可从不同方面体现研究者的学术发展。AI侧重反映研究者在某一研究方向的学术积累，H指数侧重反映研究者在相关研究领域的学术影响；③AI与G指数具有中等程度的相关性，其相关程度略低于AI与H指数之间的相关性，但同样可说明，两者既有联系，又有更明显的区别，可从不同方面体现研究者的学术发展，趋势类似于AI与H指数的关系。上述3项结果从不同角度为采用AI评价研究者学术发展的必要性提供了支持性证据。

4 讨论

4.1 FI、AI与学术创新性的关系

许多研究者与时俱进地探讨各研究领域的新生事物，因此会用到新思路、新方法和新的关键词；也有许多研究者在本科、研究生学习时期的训练就可能是跨学科的，也可能会使用更多的关键词。如何使FI、AI这2个指标在一定范围内反映或容纳研究者在自己研究的大方向上所进行的学术拓展和学术创新？解决这个问题的1个方法是：采用FI（10）、AI（10）或FI（＞10）、AI（＞10）替代本文使用的FI（5）、AI（5），以便概括研究者个人因跨学科、交叉学科研究而产生的更多关键词。实际上，本文在设计FI和AI时就已提供了这种可扩展性。即便如此，仍需说明的是，FI和AI不是创新性的量尺，其与H指数、G指数一样，都无法衡量研究者的创新性。本文的主要目的还是希望通过使用FI和AI鼓励研究者在相对狭窄的研究领域深度积累、厚积薄发。

表1 5个体育学下级学科博导中文论文发文情况及FI、AI、百度学术H指数、百度学术G指数Table 1 Chinese paper publication of Ph.D.supervisors in five different sport science disciplines and related FI，AI，Baidu Scholar H，and Baidu Scholar G

表2 FI、AI、百度学术H指数和百度学术G指数间的相关系数Table 2 Correlation coefficients of FI，AI，Baidu Scholar H，and Baidu Scholar G

4.2 FI、AI与学术影响力的关系

由于H指数与G指数高度相关（r=0.93），两者可解释对方总方差的86.49%，方差重叠部分极大，所以基本可以互相取代。又因H指数应用更加广泛，也更易理解，因此，笔者在此只讨论FI、AI与反映学术影响力的H指数之间的关系。

Cohen［14］曾在1988年提出了一个判断d值和r值大小的简易标准，其中判断r值的标准为：0.10～0.30为小效果量，0.31～0.50为中效果量，0.50以上为大效果量。本文中FI与H指数的r=-0.22，是小效果量，两者只能解释对方总方差的4.84%，另有对方方差的95.16%不能得到解释，因此，两者基本为相互影响较小的独立指标。

AI与H指数的r=0.72，是大效果量，两者可解释对方总方差的51.84%，另有对方方差的48.16%不能得到解释，因此，两者有明显关联，但不能互相取代。H指数说明某研究者学术成果的受关注程度或学术影响力，AI则说明某研究者在某一研究方向进行学术积累的程度。同时，需特别指出，此处的方差解释不是因果解释。虽然AI与H指数具有相关关系，但不意味着两者具有因果关系。

一般而言，学术积累程度越高，学术水平也越高，这就是AI与H指数具有中等程度正相关的原因。但有些研究者触类旁通、思维发散、涉猎领域较多，尽管在其中任何一个领域都没有较多学术积累，但发文量较大，也可能会有很大的学术影响力，这就是AI与H指数两者仍有很大一部分非共享方差的原因。AI不像H指数那么直接地反映学术影响力，但它的特殊作用在于可衡量研究者在核心研究方向上的学术积累程度。笔者希望通过本文引发体育科学研究者对核心研究方向进行学术积累的关注，而非仅考虑学术影响力。

4.3 FI、AI与学科领域的关系

关于FI与学科领域的关系，如表1所示，不同学科领域的FI差别不大（FI=0.57～0.66），说明这5个体育学下级学科的学术研究聚焦程度相似。

关于AI与学科领域的关系，考虑到表1中民族传统体育学和运动康复学的博导人数较少，且运动康复学又是新近设立的下级学科，笔者在本节将不对这2个学科进行详细讨论，而将重点放在运动人体科学与体育人文社会学、体育教育训练学的对比上。如表1所示，运动人体科学领域博导的AI（0.73）明显高于体育人文社会学博导的AI（0.50）和体育教育训练学博导的AI（0.45），而后两者差别不大。形成这一排序可能有以下2个原因。

（1）学科自身性质使然。尽管体育工程学、体育公共卫生等新兴学科开始成为新的热点研究领域，但传统的运动人体科学主要指6个或7个分支领域，包括运动解剖学、运动生理学、运动生物化学、运动生物力学、运动营养学、运动医学等，有时还包括运动心理学，这些学科已形成相对固定的学术传统，遵循明确的母学科研究范式，具有界定清晰的研究者共同体，跨领域、跨学科研究和进行深度积累的难度较大，使得运动人体科学研究者比较自然、相对容易地集中在某一专门领域开展研究工作和积累成果。相较而言，体育人文社会学、体育教育训练学的学科内涵与外延较难确定，包含的分支领域相对庞杂。体育人文社会学包括2个领域：体育人文科学方向和体育社会科学方向。这种合二为一的方式明显不合理，却是历史形成，现实映照。它大致包括体育哲学、体育美学、体育伦理学、体育史、奥林匹克研究、体育法学、体育社会学、体育管理学（行政管理）、体育管理学（产业管理）、体育经济学、体育传播学、体育图书情报学等。体育教育训练学也包括2个方向，即体育教育方向和运动训练方向（包括体能训练）。前者以体育教育和体育教学研究为主，后者则既可能包括运动人体科学、体育人文社会科学方向的跨领域研究，也可能包括运动训练理论与实践方面的独特研究，如运动员选材、训练安排、技术统计、比赛准备等。这种庞杂的现状使得体育人文社会学、体育教育训练学2个学科要想形成独特的学术传统、相对统一的研究范式、稳定的研究方向、范围明确的学术共同体，有其自身较难逾越的屏障。这种学术传统和发展态势肯定会影响研究者自身的学术定位，包括学术理念的认同、研究方向的确定以及研究成果的积累。

（2）研究者自身倾向使然。有些研究者可能比较注重在单一方向上的学术积累，大胆假设，小心求证；有些研究者比较善于触类旁通，发散思维，涉猎不同领域。2种方式都有可能产生较大的学术影响力。当然，相较而言，前者因在其学术研究核心方向上的积累程度更高，其学术影响力也会更大，毕竟AI与H指数的r=0.72。本文结果显示，通过学术积累（AI）可解释H指数总方差的51.84%，但没有论据证明，通过学术发散可解释H指数总方差的另外48.16%。这48.16%的未解释方差，其来源仍是未知的。

4.4 FI、AI与关键词专业性的关系

为计算FI与AI的分子数值，笔者查询了中国知网和万方数据库收录的193名博导的全部中文论文。在手动计算前5个关键词累计频数的过程中，发现有28个非专业性“关键词”出现了99次（表3）。体育学不同专业博导中文论文人均、篇均非专业性关键词统计结果如表4所示。笔者还计算了研究者个人使用非专业性关键词的频数与FI（r=-0.02，P=0.746）、AI（r=0.20，P＜0.01）的相关性，结果均为小效果量，即很难通过非专业性关键词的频数预测FI和AI，反之也一样。

尽管如此，非专业性关键词的使用频率之高还是应当引起体育科学研究者的重视。体育科学所含学科众多，体系庞杂，学术话语体系不统一，无公认的研究范式，因此，难有统一标准指导关键词的使用。但像“现状”“发展”等词汇因明显不带有专业性质和学理价值，不应算作“关键词”，这一点或许比较容易得到体育科学研究者共同体的认同。显然，今后在撰写论文的关键词时，应避免使用这些无法体现研究的实质性内容且降低论文学术性的词汇。出现这种非专业性关键词可能有2个原因：①在本科、研究生阶段对文献信息素养的培养不够重视；②在职业生涯阶段对学理倾向、学术积累不够重视。因此，要彻底解决这个问题，还需从这2个源头着手。

表3 体育学中文文献中的非专业性关键词统计结果Table 3 Pseudo keywords in Chinese sport science literature

表4 体育学不同学科博导中文论文人均、篇均非专业性关键词统计结果Table 4 Statistics on per person’s and per paper’s pseudo keywords in Chinese papers of different sport science literature

4.5 FI、AI与不当学术行为的关系

从博导的视角讨论FI、AI与不当学术行为的关系。所谓不当学术行为是指对学术积累和学术发展不利的学术行为。它们可能是学术不端行为也可能不是，严重的不当学术行为就是学术不端行为。

如果某博导的学生选择其完全不了解的研究方向做学位论文研究，之后，在期刊发表1篇学位论文的核心部分时将其博导作为作者之一，虽然该博导的发文总数增加了1篇，但其前5个关键词累计频数可能未增加，FI将降低。长此以往，该博导的FI会逐渐降低。同时，随着时间推移，该博导所在学术团体的人均发文数不断增加，但其前5个关键词累计频数未增加，其AI也将不断下降。

如果某博导对某项研究未做出实质性贡献，该研究方向也不是其主要研究方向，但该项研究将其列入作者名单，这篇论文的关键词均无法被列入所发论文前5个关键词累计频数，FI将降低。同时，如果该博导所在学术团体的人均发文数不断增加，其AI也将不断下降。

如果某博导所发论文（哪怕是第十作者）的关键词含有“现状”“发展”这类非专业性关键词，根据本文的计算方法，将从频数递降的后续专业关键词向上递补，将前5个关键词的累计频数作为FI或AI的分子，其数量将有所减少，此时，FI和AI都将有所下降。

如果某博导所发论文不是其研究方向所指，这篇论文的关键词则可能无法被列入所发论文前5个关键词的累计频数。此时，该博导FI和AI的分子未增加，但论文总数增加了1篇，则FI会下降。同时，如果其所在学术团体的人均发文数不断增加，AI也会不断下降。

可能还有其他与FI、AI关联的不当学术行为。为避免这些不当学术行为，更好地促进学术积累和学术发展，建议体育科学领域的博导：①在学生选题时，帮助学生选择导师熟悉、有学术积累的研究方向作为其学位论文的研究方向，尽量避免学生的选题偏离自己的核心研究方向；②在申请课题时，只申请自己熟悉的研究领域且有学术积累的课题；③在开展研究时，尽量聚焦自己的核心研究方向，不断积累研究成果，以便在更细、更专、更深的层次上做进一步探索；④在撰写论文时，精心选择关键词，并在关键词代表的学术方向上展开有理有据的讨论；⑤在论著署名时，只在自己作出了实质性贡献且为自己研究方向的论文和著作中署名。

在不断涌现新研究领域或新研究热点的背景下，既要保持足够的学术敏感性，也要注意在自己熟悉且有一定积累的学术领域拓展研究方向，而不是盲目追逐研究热点，即应在与时俱进与恪守传统之间保持动态平衡。

5 结束语

本文亦有一些明显的局限：①在研究者发文量极低的情况下，FI可能失去其所被期望的功效。②采用AI评价跨学科、交叉学科领域的研究者存在一定局限性，因为这些领域的研究者学术发散性、整合性更强，许多研究的创新性更明显。③在计算FI和AI时，未区分发表论文的质量，低质量论文与高质量论文起着同样作用，解决方案之一是只纳入核心期刊的中文论文或CSSCI收录的中文论文，但这会导致不能全面地反映研究者的学术成果。④学术积累的评价未包括著作、教材、会议论文、重要讲座等，而这些内容也部分反映了研究者的长期学术积累。⑤仅以中文论文及其关键词为统计数据来源存在一定缺陷。在文献检索、梳理、统计之前的研究设计阶段，笔者就认真思考过这个问题，但因以下3个原因未统计英文文献：第一，就中国体育科学领域的发展现状而言，即便是博导这一学术团体所发论文仍以中文为主，英文论文数大大低于中文论文数；第二，在中国知网、万方2个数据库查找、统计193名博导所发中文论文，去重，然后翻阅每篇论文，找出关键词，录入Excel文件，列出前5个关键词，已远超预期工作量，如果统计英文论文，还要解决多个英文文献数据库联合检索，去重，中英文人名、机构、关键词对应等一系列问题，这超出了笔者团队的能力范围，因此放弃了这一想法；第三，本文的目的是提出一个简便易行、可操作性强、学术认可度高的学术积累评价方法，并据此提醒体育科学领域的研究者注意自己的学理倾向和学术积累，而通过中文文献的统计分析，基本可以达到这一目的。

为量化评价研究者个人在其核心研究方向的学术积累和学术发展情况，本文通过所发论文前5个关键词的FI和AI分析了4所体育院校193名博导的学术积累和学术发展情况，提出可用FI评价研究者个人在其学术研究核心方向上的聚焦程度，可用AI评价研究者个人在其学术研究核心方向上的积累程度，认为这2个指标特别是AI的使用有助于促进研究者个人的良好学术行为和长远学术发展。

笔者希望读者提出质疑，不吝赐教，或提出更好的评价方法。相信促进体育科学成为具有坚实学术积累的“金字塔”是作者与读者双方共同期待的目标。

学者评论

易剑东：学术是一种志业，还是一种专业抑或一种职业？读完张力为教授等的《FI与AI：评价体育科学研究者学术积累的新方法》一文，笔者感受到了其对中国体育科学界的高度关切之心。这是张力为教授一贯以来不仅致力于运动心理学特定问题研究，而且关注体育科学一般问题研究的学术风格的体现，也是中国体育科学研究迅速转型和逐步升级的需要。显然，论文的价值和意义是重大的，对于笔者认为的目前总体上仍然处于前科学或潜科学阶段的体育科学而言，这样的研究成果不仅必要，而且值得大加推广和应用。

文中提及用核心方向聚焦指数（FI）评价研究者个人在其学术研究核心方向上的聚焦程度，用核心方向积累指数（AI）评价研究者个人在其学术研究核心方向上的积累程度。笔者认为，当前这不仅适合于体育科学界的研究者影响力评价，也适用于整个中国学术界的研究者影响力评价。

当然，体育科学界自身的特殊性我们不可不察。也正是在对中国体育科学界某些特殊问题的观察、思考的基础上，笔者提出几个特殊问题，以供张力为教授及读者们参考。

（1）在笔者看来，中国体育科学界目前基本还没有严格的学术共同体。主要原因有2点：①中国的体育院校和体育科研机构的机构设置多是笼统、混沌、综合的，各地的体育科研所也大体是多学科汇总的机构，而艺术院校和艺术科研机构早已有电影、舞蹈、音乐、美术、戏剧、戏曲等自成体系的分立。因此，身处这样机构之中的体育科研人员本身就难以深入聚焦和实现精细分工。如运动生物力学、运动营养学等学科的研究者很难根据不同运动项目的细分长期、专门、深入地研究有关问题，只有少数进入国家队科研服务体系的研究者才有可能获得深入探究专业问题的便利条件。近年来，不少体育院校恢复了20世纪“设立单项运动系科”的做法，成立一些单项运动学院，但不太可能在短时间内围绕运动项目生发出特定的科研成果和产出专项运动科研专家。②中国体育学术刊物多数是综合性的，体育学二级学科的相关研究汇集在1本刊物上是常态。各体育院校学报和体育科研机构主办的刊物绝大多数是综合性刊物，像《中国运动医学杂志》这样的单学科学术刊物较为罕见。这样的局势使大多数学术刊物编辑不得不变成“万金油式的专家”，在人员规模有限的情势下，很多刊物连具有体育学二级学科背景的编辑都难以配备齐全。所以在近几年中国体育学术刊物的发文中，体育人文社会学的发文量越来越大。这或许与这个学科的门槛看上去较低有关，也与这个学科的研究内容易引起公众的关切甚至讨论有关。与此形成极其显著的反差是，欧美国家的体育学术刊物是精细分工和细致分科的，运动医学、运动心理学、体育史学、体育管理学等单科学术刊物占据主流。

由于中国现有体育学二级学科设置的粗疏和综合性学术刊物格局的限制，中国的体育学术管理体系也是粗放的。如体育法学的学术论文很可能会被送至体育经济学背景的评审人审稿，这种在别的学科里基本不会出现的现象，在体育科学界却可能是常态，这直接影响了学术评价和管理机制的专业性和科学性。无专业分科和精细分工的体育科学界很难产出深入研究体育学术问题的专家，这恐怕是一种合乎逻辑的恶性循环。也正因此，张力为教授等发现运动人体科学研究者的学术聚焦程度有着明显优势，体育人文社会学、体育教育训练学这2个学科研究者的学术聚焦程度明显较低。

（2）缺乏学术共同体导致中国体育科研的服务体系缺失。举一个很简单的例子：哈贝马斯是当今世界著名的哲学家，他的几乎所有著作都被翻译成中文，国内社会哲学等学科的研究者都可在不读德语原著的基础上展开自己的研究，而我们要研究体育科学界很多国际知名研究者的思想，或借助他们的思想研究中国的有关问题，就无法获得这样的学术服务。毕竟体育科学界规模有限，绝大多数国外的优秀学术作品都难以翻译成中文供国内研究者参阅。国内研究者要研究国外研究者的学术著作和论文等面临着极大的跨语言学习的压力。这一点与体育科学界的离散度较大有关，更与体育科学界的规模较小密切相关。从本科生招生规模看，体育类招生规模不足全部专业类别的0.5%。至少从笔者较熟悉的体育人文社会学领域看，研究者的研究很难得到学术共同体的支持，进行深入研究的难度极大。如笔者最近研究的“东京奥运会推迟1年”问题，下载和阅读的英文文献就超过5 000页，因为可以参阅的中文材料基本没有。

（3）体育科学界的学科管理制度极大影响了体育学术研究的深入。体育科学是综合性学科，包含“理解为本”的人文学科、“解释为本”的社会学科、“证明为本”的自然学科、“应用为本”的工程学科等，这些学科往往聚集于一个学校或研究所的科研管理机构中，相互之间很难得到公平对待。当今世界范围内的学科评价又有着明显的重自然学科、轻人文社会学科的普遍取向，有着重引用率和经费额度的惯常管理办法，这些特点投射到不同学科的研究者心中，自然是“苦乐不均”的，这也直接影响了学术研究的深入和学术水平的提升。而体育系统内的功利性提升竞技成绩的压力和其他相关实用性目标的诱引，更使得基础理论学科的生存空间日益逼仄，带来了学科发展的不均衡。这些现象已固化于体育科学研究者所处的机构中，成为影响他们科研活动的“指南针”和“晴雨表”。笔者从中美职业分类的比较中发现，美国的体育科研工作主要内容被描述为：聚焦体育和身体活动的心理学、社会学和历史学方面，包括体育理论、运动心理学、美国社会的体育、性别和种族/少数民族与体育、体育历史等。其余与体育有关的自然科学基本被归属于其母学科的研究。中国的情形基本相反，体育自然科学总体繁盛，而体育人文社会科学整体欠缺，不仅研究者规模有限，而且多数在母学科体系中地位较低或缺乏归属。在欧美国家，体育人文社会科学的众多分支学科，如体育经济学、体育史学、体育法学等都可在综合性大学的非体育院系找到不少研究者。

（4）还有一个令人担忧的现象不得不在此提及，目前中国的运动人体科学博士生导师数量众多、发表论文最多，但硕士生和博士生的生源质量令人极度担忧。很多体育学博士招生单位出现了运动人体科学专业博士生录取的外语分数线以及总分录取线最低的窘况。尤其令笔者惊愕的是，2020年某体育院校的博士生复试分数线出现了民族传统体育学外语分数线为70分而运动人体科学外语分数线为30分的巨大反差，更是出现运动人体科学总分的复试分数线为130分而其他学科均为200分以上的尴尬景象。这种局面如果持续发展下去，运动人体科学在体育科学体系中的优势地位恐将逐步丧失。

回到本文题目的问题：学术是一种志业（马克斯·韦伯），还是一种专业抑或一种职业？对这个问题的回答其实至关重要。目前体育科学学术研究问题的症结也许就在于：很少有人把科研或学术作为一种精神追求和个人旨趣，多数人将科研或学术直接服务于教学工作或其他实际工作，或将其视为谋生的手段。所以很难见到纯粹或真正意义上的体育科研或学术成果。总之，笔者认为，中国体育科学研究者整体数量少，学科综合性强，研究者异质性鲜明，加之管理的笼统性、混沌性，在短期内要在中国形成所谓的体育学术共同体几无可能。正是在促进体育科研工作者形成独立的学术意识意义上，笔者认同张力为教授等提出的FI和AI的学术价值和现实意义，但同时又认为解决体育学研究者的学术专精水平和学术聚焦能力，还需从解决制约中国体育科研的管理体制入手，如立足运动项目构建学术体系，围绕不同学科创办学术刊物，依据母学科基础建立管理制度等。如此才能看到中国体育学术的专精和细分以及研究者们在此基础上的聚焦和积累，从而涌现出可与其他学科优秀研究者相媲美的体育科学研究者。

（易剑东，温州大学教授，博士生导师，“百千万人才工程”国家级人选，有突出贡献中青年专家，国务院特殊津贴专家）

初景利：从FI和AI看学术评价的若干关键问题近日有幸拜读了《FI与AI：评价体育科学研究者学术积累的新方法》一文，非常惊喜，也很受启发。该文作者从现有的体育科学（乃至其他所有科学）研究中存在的研究成果主题不够聚焦（研究主题过于分散）和研究成果缺乏深度（研究主题不具有前沿性）等问题提出了核心方向聚焦指数（FI）和核心方向积累指数（AI）2个指标。论文的学术思想富有创新性，研究视角很独特，提出的指标有很强的实际应用价值。

结合该文以及笔者的认知和感悟，针对学术评价的相关问题进行如下探讨。

1 关于学术评价的核心问题

学术评价是一个非常重要的问题，也是争议性较大的问题。说它重要，是因为学术评价需体现其应有的公平性和公正性。如果评价结果不能客观地反映科学研究及其成果的真实水平，则学术评价必然失去其公信力，也就失去了评价的意义，甚至适得其反，带来不良后果和影响。因此，不断地寻求学术评价客观、公正、科学的评价指标与方法，一直是学界和学术共同体的共同追求。从目前的研究成果看，我们还远未达到这一目标。这确实是一个非常复杂的问题，不同的学科领域、评价对象、评价需求、评价主体等交织在一起，难以形成一套规范、普适的评价标准与体系。尽管关于学术评价的研究很多，但往往从不同的学科角度或科研认知出发，真正得到学术共同体公认的理论、方法并不多见。这有待于学界继续深入研究和探讨。

2 关于FI和AI

从理论上看，FI和AI这2个指标在一定程度上弥补了目前学术评价的不足。在国内外众多研究成果中，长期以来以英文SCI收录期刊和中文核心期刊论文为主导，以引文、下载、基金比等外在评价指标评判研究成果的水平，引导作者迎合期刊的评价，而不是审核和评判1名研究者学术研究的深度、创新性。学术期刊的评价自有一套指标体系（暂且不论其科学性与合理性），但并不一定适合或完全适合对科研个体（科研机构或科研人员）的学术水平进行评价，对科研个体的学术评价应更有针对性和个性，更贴近学术评价的初衷和需求。因而，FI和AI这2个指标具有理论意义和学术价值。

从实践应用上看，这2个指标可操作性强，具有非常好的实际应用价值。无论是科研人员还是科研机构，只有在某一个或几个领域长期积累，并持续有深度地研究问题，才会不断推出有价值的学术研究成果，形成更多稳定的学术研究方向，提升学术影响力。这2个指标有利于引导科研机构和科研人员持续、稳定、深入地研究某一个或几个重大理论或实际问题，形成“良好的学术研究，不在于研究成果的数量，而在于研究成果的质量”的研究导向，这也与国家（科技部破“四唯”、教育部破“五唯”）的学术评价政策相一致。

此外，该文作者也论及这2个指标的局限性，非常客观，因为任何评价都是在一定的环境或条件下才可能适用。

3 关于FI、AI及学术评价研究的建议

（1）既应关注评价指标的创新性，也应关注其适用性。没有一套指标具有普适性，能一劳永逸地解决一切评价问题。好的评价指标固然重要，但不能滥用。不同的评价指标往往能满足某种特定的需要，对特定的需求或问题具有应用价值。FI和AI亦如此，这2个指标可用于评价科研个体研究成果的聚焦程度（研究深度）和积累程度（学术前沿性），这2个方面无疑是研究水平的重要体现。我们应鼓励更多的研究者成为专家，而不是杂家（尽管杂家也需要，但不是主体）。建议学术评价应更多地关注个体科研成果的研究深度和创新水平，与代表作制度等相结合，形成更合理和客观的评价体系，摒弃追求论文发表的期刊“级别”和发文数量的多少，使得在学术评价引导下的科研活动走向理性与良性。

（2）高度关注评价指标的适用性和局限性。应鼓励从单一维度、多个维度乃至全景维度对学术评价的理论、方法、指标、模式等进行更多的深入探讨，通过实践检验不断地过滤和吸纳相应的学术评价研究成果。任何一份学术评价研究成果既要指出其意义和价值，也要指出其适用性和局限性，这才是科学的态度。该文作者在文中充分分析了2个指标的局限性，体现了作者对2个指标的意义的充分认知，这其实也是今后研究的一个新的领域，值得更多研究者进行更深入探索。这一研究范式会更好地推动评价研究的发展。此外，我们往往过多地关注评价指标的积极意义，而忽视了其潜在的局限。如我们比较追捧的H指数，连发明人自己都认为其存在一些问题，但这并不影响使用。建议对任何一种评价指标都要客观看待，理性使用，结合需求，充分考虑其适用性，避免在学术评价中的误区。

（3）不断探寻更合理的学术评价体系。任何一种评价都有其目的和适用条件，都有其一定的意义和作用。更多的、适应不同需求的、有价值的评价指标相结合，就会构成相对完备的学术评价体系，以供人们选择性使用，并构成面向具体场景、问题和需求的独特评价体系。我们更需要类似于FI和AI这样的创新，而不是重复性研究。国内外关于学术评价的成果众多，但视角独特、创新性强的评价指标体系还比较缺乏。学术评价的研究需要对科学研究活动有深入洞察力，对科技创新有深刻理解和认识，对学术研究成果的意义和价值有良好的判断力和认知水平。建议研究者们既要懂得评价的本质与核心问题，又要具备丰富而深入的学术积累，从而对学术评价做出前瞻而科学的顶层设计。

上述意见不一定恰当，仅供作者和读者们参考与讨论。希望通过更多的思考、讨论、研究、实践，寻求更加符合科学理性的学术评价理论、方法、技术、模型和范式，以产出更有价值、对国家更有贡献的科技人才和学术成果。

（初景利，中国科学院文献情报中心期刊出版运营总监，中国科学院大学图书情报与档案管理系主任，教授，博士，博士生导师）

刘炜：小议张力为教授等的FI与AI指数拜读了张力为教授等的《FI与AI：评价体育科学研究者学术积累的新方法》一文，觉得既有意义，也很有价值，值得大家一起深入探讨。下面谈谈笔者的认识与感想。

1 提出评价研究者学术积累指数的积极意义

高水平的学术研究通常建立在丰富的学术积累和对某一问题进行系统研究的基础上。注重学术积累可有效避免研究者进行低水平的重复性研究。目前学术积累的重要性已引起不少研究者的高度重视，但尚无相关的定量评价方法。

笔者仔细考察该文提出的核心方向聚焦指数（FI）与核心方向积累指数（AI）的计算方法，并认真阅读全文后，认为张力为教授等的主要目的应该是希望通过这2个指数提醒和鼓励研究者在相对较窄的领域中进行系统、深入研究，形成自己的核心研究领域，并在该领域中进行深度积累，以便在此基础上取得高水平研究成果。因此，张力为教授等提出要建立评价研究者学术积累的指数有着积极的意义。

2 学术积累的测度

突破性的研究成果多是在丰富的学术积累基础上取得的。学术积累至少包括相关研究资料和研究成果的积累。其中研究资料的积累是做好研究的本质需要，研究成果的积累更多地反映在学术贡献、学术成就等方面。张力为教授所提的“学术积累”主要是指研究成果的积累。

研究者研究资料的积累通常较难从公开途径获取信息并对其进行测度，而对研究成果积累的测度相对容易。研究资料和研究成果的积累是相辅相成的，在聚焦于某一领域的资料积累过程中常常可以不断产出成果，而对某一领域的系统研究也会不断促进和指导研究资料的积累，很多研究成果本身也是极具价值的研究资料。因此，即使仅从某一研究领域研究成果的积累反映研究者在该领域的学术积累也还是有可取之处的。

在测度研究成果的积累时，又可考虑以下2个方面：①研究者对核心研究领域的聚焦程度；②研究者在核心研究领域中的研究成果积累量。其中，在核心研究领域中的研究成果积累量是反映研究成果积累的核心指标。对核心研究领域的聚焦程度高，将有利于在该领域积累研究成果，但也确实存在少数多才、多产的研究者在若干个领域都有较好的研究成果积累，因此，聚焦程度是反映核心研究领域中研究成果积累度的辅助指标。

3 FI与AI的合理性与局限性

该文提出的FI为“某研究者所发论文的前n个（n=1，3，5……）关键词累计频数与所发论文总数的比值”，可表述为：

式（1）中，n=1，3，5……。

笔者认为，用FI反映研究者对核心研究领域的聚焦程度有一定的合理性。如果科研领域可划分为不重叠的若干分领域，而每个分领域都与确定的关键词一一对应，则用FI反映研究者的研究聚焦程度是相当合理的。但在具体实践中，不同科研领域使用关键词的习惯不同，目前大部分研究领域对关键词的取法并无定规，相对比较随意，这就使得FI的有效性打了折扣。不同研究者使用关键词的习惯也不同，有的研究者习惯使用能精准反映研究内容的关键词（对应较小的研究领域），而有的研究者习惯使用含义较为宽泛的关键词（对应较大的研究领域）。显然后者更容易取得较高的FI值。

该文的AI为“某研究者所发论文前5个关键词累计频数/该研究者所属学术团体的研究者发表论文的平均数”（学术团体可以是学术组织、研究机构、学校院系、研究生导师团体等）：

由于AI的计算基于该研究者所属“学术团体”，而1名研究者可以同时属于很多个“学术团体”，所以即使在1个明确的时间点，1名研究者也可以有多个AI值，而且这些AI值可能会有很大差异。另外，如果一个研究者调换单位，也可能会使AI发生很大变化。因此，笼统地给出1名研究者的AI是不明确的，必须同时指出该AI是基于其所属的哪个学术团体计算的才有意义。同时，因为AI值的计算方法是基于集体评价个人，不同学术团体中的研究者之间可比性较差，不宜用该指数对属于不同学术团体的研究者进行个人比较。

综上，笔者认为，反映研究聚焦程度的指标用相对量比较合理，而反映积累程度的指标用绝对量更为合理。因此，建议将AI改为：

式（3）中，n=1，3，5……。各个研究领域可以根据本领域的具体情况及使用场景取合适的n值。

4 FI与AI的使用建议

（1）计算FI、AI值时应剔除不能反映所研究问题的关键词。研究者在论文中标注的关键词可能并不都能反映研究问题（研究领域），也会出现不少反映研究类型（如“现状调查”）、研究方法（如“实验研究”）、研究工具（如“因子分析”）的关键词。在计算FI、AI值时，应剔除这些不能反映所研究问题的关键词。

（2）FI、AI值要结合相应的高频关键词一起使用。由于关键词可反映一个较小的研究领域，也可反映较大的研究领域，所以FI、AI值要结合相应的高频关键词一起使用，而不能只用指数值说明问题。

（3）不根据FI、AI值直接对研究者的学术水平或影响力进行判断。FI、AI可在一定程度上反映研究者在某些研究方向上的聚焦和积累程度，但“专才”和“通才”各有所长、各有各的作用，研究的聚焦和积累程度较高不能说明其研究水平较高。另外，研究的聚焦程度在某些学科领域（如实验科学和一些基础理论研究）中显得尤为重要，但在某些领域（如应用研究或宏观管理实践研究），为了跟上社会、经济的发展、变迁，研究问题会相对较宏观，特别是在正在经历变革和快速发展的社会中。因此，不能根据FI、AI值直接对研究者的学术水平或影响力进行判断。

（4）FI除了用于研究者个人，也可用于学术团体。笔者建议，某学术团体的FI可表达为：式（4）中，n=1，3，5……。团体FI可在一定程度上反映该团体研究方向的聚焦程度，其局限性与研究者个人FI的局限性相同。

（5）可以考虑使用“研究者在某个研究方向上的FI、AI”，而不是笼统地评估某个研究者的FI、AI。但这需要人工判断论文的关键词是否属于特定的研究方向，可操作性会受到一定影响。

（刘炜，上海体育学院副教授，中国体育科学学会体育统计分会副主任委员）

作者贡献声明：

张力为：设计研究，撰写、修改论文；

李丹阳：采集、分析数据，撰写、修改论文；

杨红英：设计研究，修改论文。