基于文本聚类法的高校电工学科创新竞争力评价研究

2023-08-11 07:06刘紫熹魏冠元单子婧李一涵
黑龙江科学 2023年11期
关键词:电工竞争力电网

刘紫熹,魏冠元,单子婧,李一涵

(1.国网能源研究院有限公司,北京 102209;2.华北电力大学 经济与管理学院,北京 102206)

0 引言

高校作为产学研用一体化发展中不可或缺的一环,其创新能力的高低往往能够体现其所在地区的经济发展情况。电工学科作为历史悠久的学科,其已深度融入地方生活并对经济发展起支撑作用,具有广阔的发展前景和发展潜力。了解各地区高校在电工领域的科技创新资源布局现状,能够有效掌握当地电力行业的创新发展情况。创新竞争力资源布局对区域经济发展及电力技术发展有着至关重要的作用,合理进行高校学科创新能力评估有助于优化科技创新竞争力的资源布局,从而促进区域经济发展。

有较多学者对高校科技创新能力评价进行研究:徐朋辉等使用因子分析法,对安徽省30所本科院校的科技创新能力进行分析评价,分析了当地高校的发展趋势[1]。安蓉等基于高校创新相关要素构建了地方高校创新能力评价指标体系,采用因子分析法评价地方高校创新能力,为西部地区高校的发展提出了建设性意见[2]。郭俊华等基于科技创新的发展现状,以全国各地高校为研究对象,从5个维度构建了高校创新能力指标评价体系,利用因子分析法对比分析各高校的科技创新能力,从全国视角提出建议[3]。韩晓明等结合主成分分析法与熵权法,选取100所高校为研究对象,构建高校科技创新能力评价指标体系,对高校的特点进行归类对比,归纳不同类型高校的创新发展情况并对其未来发展提出建议[4]。张俊婷等引入熵权-DEMATEL法,修正了熵权法中可能出现的偏差,对江苏地区40所高校进行分析评价,总结了各个创新能力评价指标之间的关系[5]。熊国经等引入基于E-TOPSIS的改进因子分析法,以泛珠三角地区的高校为研究对象,将影响和表现学科竞争力的因素转换为可量化数据,提出有关地区高校发展的建议[6]。白玉等使用扎根理论分析高校科技创新能力的内涵,在定性分析的基础上将相关因素定量化,构建了包含91个概念的评价模型[7]。李春英等以高校“双一流”建设为研究背景,系统组合众多因素,构建了高校学科竞争力评价层次结构模型,将定性指标分类转化为定量指标[10]。现有研究中对高校科技创新竞争力的关注点较为宽泛,大多从高校所有学科统计数据出发研究高校整体的创新竞争力,但不同的高校有各自的代表学科及重点发展学科,将关注点放在某一类学科或某一门学科上不仅能更准确地评价高校的创新竞争力,也能更好地把握所评价高校的特点。

选取传统学科中的电工学科,分析高校电工学科的建设情况,结合电工领域横纵向课题的项目分类特点将电工学科划分为14个细分领域,利用基于TF-IDF算法的文本聚类方法将海量论文数据归类至不同细分领域,实现以技术领域为导向的精细化评价。依据电工领域的专业特性与应用特点,基于文本聚类的方法构建高校电工学科创新竞争力评价指标体系,运用AHP-熵权法设置权重,利用TOPSIS法对国内100所高校的电工学科进行创新竞争力评价及实证分析,以反映高校在电工领域培养人才、科学研究及社会服务方面的创新能力,以推进电工学科教育改革创新,帮助企业选取合作对象,推动产学研用一体化发展,促进资源的高效精准投入。

1 研究方法

基于TF-IDF算法对高校论文成果进行聚类,将所选取的论文数据归类,细分其技术领域,突出高校在电工领域的优势学科及其资源分布情况。确定高校指标后,搜集各指标所需数据,采用组合赋权法对指标赋权,依据各要素的关联度构建多层次分析模型,用熵权法判断各指标的离散程度,分析其对综合评价的影响程度。确定各个指标的权重后,通过TOPSIS法评价各高校电工学科的创新竞争力水平,以相对距离为评判标准,将评价对象的方案与最佳方案和最差方案相比较,得到各高校的评价结果。具体研究框架见图1。

图1 基于文本聚类法的高校电工学科创新竞争力评价研究框架Fig.1 Research framework of innovation competitiveness evaluation of electrical engineering in colleges and universities based on text clustering

1.1 基于TF-IDF算法的文本聚类方法

电工学科涵盖的技术范围十分广泛,为对其进行精确评估,参考国家自然基金电工领域项目[11]及电力企业横向项目的划分类型,结合高校电工学科结构,依据不同技术特点将电工学科分为14个不同的领域,详见表1。

表1 电工学科细分技术领域Tab.1 Electrical engineering subdivisions in the technical field

为按领域对获取的指标数据进行分类,采用TF-IDF技术进行学术论文关键词提取。若某一词语出现频率高,且在语料库的其他文本中出现频率相对较少,则认为其具有很好的类别区分能力,适合作为关键词进行分类。

TF-IDF由词频(term frequency,TF)与逆向文件频率(inverse document frequency,IDF)组成,计算方式为二者相乘,如式(1)。

TF-IDF=TF×IDF

(1)

其中,TF和IDF的计算方式见式(2)、式(3)。

(2)

其中,ni,j为特征词ti在文件dj中出现的次数,nk,j为文件j中词条k出现的次数。

(3)

其中,|D|为语料库中的文件总数。

得到文本特征向量后,使用K-means算法按照关键词向量将学术论文聚类为14类,文本聚类的具体流程见图2[12]。

图2 基于TF-IDF算法的文本聚类流程Fig.2 Text clustering process based on TF-IDF algorithm

1.2 组合赋权法

赋权方法主要分为主观赋权法与客观赋权法,主观赋权采用层次分析法,依据专家经验对评价指标的重要程度打分,带有一定的主观随意性。客观赋权法通常根据实际数据的变异程度为不同指标赋权,容易受离群点影响,且忽视了专家经验对于指标设置的贡献。故采用层次分析法与熵权法[13]相结合的组合赋权法进行权重设置,在保留专家实践经验的同时弱化个人主观意见对权重大小的影响。

设pj、qj分别为基于AHP和熵权法生成的评价指标xij的权重系数,γ为决策者偏好(0≤γ≤1),则组合权重系数为:

wj=γpj+(1-γ)qj,(j=1,2,…,n),0≤γ≤1

选取30名电工领域专家为调研对象,以问卷形式对电工领域创新竞争力水平各影响因素的重要程度进行打分,利用matlab软件判断矩阵一致性并进行主观权重计算,运用指标熵权法对主观权重进行修正,最终得到组合权重。

1.3 TOPSIS评价方法

采用逼近理想解排序法(TOPSIS)综合评价各高校在电工领域的科技创新能力水平。TOPSIS是一种确定情境下的多属性决策方法,可同时评价多个对象,将研究对象的决策方案与最佳方案和最差方案进行比较,以它们相对距离的远近评判方案的优劣。

构建原始数据决策矩阵X,利用极值处理法对决策矩阵进行标准化处理,计算加权标准化判断矩阵U。

确定相对正负理想解,见式(5)、式(6)。

(5)

(6)

计算判断矩阵各元素到正理想解和负理想解的欧式距离,见式(7)、式(8)。

(7)

(8)

计算评价值Ci并排序,评价值计算方法如下:

(9)

2 评价指标体系构建

科学准确评价科技资源的创新竞争力,需建立适用于不同评价对象的科学、合理、可操作的评价指标体系,使评价结论更加全面、科学、客观。依据建立评价指标体系的系统性、科学性、可比性、可行性及导向性等基本原则[16],构建包含多级指标因素的电力领域高校创新竞争力评价指标体系。为体现评价指标的科学性和统一性,所有指标均参考国家或教育部的科研基础及获奖标准,考虑到电工学科的特色,增加了IEEE会士人数及电力领域校企合作情况两项指标。详见表2。

表2 高校电工学科创新竞争力评价指标体系Tab.2 Evaluation index system of innovation competitiveness of colleges and universities in electric field

1)科技创新资源与基础条件。科技创新资源与基础条件能够反映高校开展科技创新工作所具备的平台搭建能力和条件保障能力,是高校在科技创新领域人力、物力、资金供给及软环境配备等多方面实力的综合体现。

2)科技创新投入能力。科技创新投入是高校进行原始创新活动时投入的科技资源,主要通过人力资源投入与科研项目经费获取两个指标来衡量,其中人力资源投入最为关键,主要通过高校中电工领域的科学研究与试验发展(research and development,R&D)人员占比、院士数量、国家高层次人才与国家优秀人才引进数量及IEEE会士数量来衡量。

3)科技创新产出能力。科技创新产出能力是各高校将创新资源与科技投入有效转化为科技成果的能力,进行高质量的知识创新是高校科技创新活动最重要的任务之一。

4)科技创新合作与交流能力。科技创新的目标是推动国家或地区的知识流动,尤其是促进知识在研发机构、企业、中介机构间的有效流动。高校是知识创新的主要发源地,新知识、新方法、新理论封闭在大学课堂里无法体现知识创新的真正价值,科技创新合作与交流能力是高校科技创新竞争力的重要体现。

3 高校电工学科创新竞争力评价

3.1 数据来源

整理国内在中文核心期刊上发表过电工领域学术论文的所有院校,通过发文量、学科评估等级等指标进行初步筛选,选取其中106所院校进行最终的竞争力评价。高校学科指标数据的主要来源为各院校的电气工程院系网站、科技统计年鉴或相关报告,专利数据来源为IncoPat全球专利数据库,论文数据来源为中国知网论文数据库(仅选取北大中文核心目录期刊论文)。所有数据的时间范围均为2017—2022年。

3.2 评价结果

对所选106所高校进行评价排序,对各高校在14个领域(见表1)的排名情况进行汇总,剔除各领域均排在51名以后的学校,列出余下67所高校(表格中第二行第二列数字“10”表示清华大学在10个细分领域中排名第一)。由表3可知,清华大学和华北电力大学在所有领域中均排在前两位,主要原因是评价体系中论文发表情况的权重较大(各领域平均占比15%左右)。区别于综合型高校研究的广泛性,华北电力大学在学术研究中具有较强的电力行业特色,其研究时间范围内在电工领域的总发文量为3129篇,高于总发文量第二名西安交通大学两倍(1466篇),在各领域的创新竞争力评价中表现出一定的优势。进入高校创新竞争力各领域前三名和前十名高校分别有9所、20所。

表3 高校电工学科创新竞争力各领域排序Tab.3 Ranking of scientific and technological competitiveness of colleges and universities in various fields

为便于对比分析,将14个细分领域合并为5种类型,对评价结果进行统一分析。

1)第一类技术领域包括大电网安全分析与规划技术、电网防灾减灾技术、电网环保与节能技术、配用电与微网技术4个电网相关领域。从区域分布情况看,该类相关技术的高水平科技资源在全国范围内分布较均匀,前20名高校所在区域涉及全国一半以上省份,各电网区域均有资源分布,但各电网区域内部资源分布并不均衡,存在显著的阶梯级分布现象,如华北电网集中于北京,华东电网集中于江苏省,华中电网集中于湖北省等,见图3。

图3 第一类技术领域创新竞争力前20名高校布局情况Fig.3 Layout of top 20 universities in the first type of technological innovation competitiveness

2)第二类技术领域包括电力通信与电力信息技术、电力电子及电能质量技术、电力系统自动化技术3个电信电子及自动化相关领域。从电网区域分布看,各电网区域间的优势科技资源呈现阶梯型分布,华东电网在该类领域的优势较为明显,其次分别是华北、华中电网.相较于第一类技术领域,第二类技术领域在电网区域间呈现出更大的差距,西北、东北电网的科技资源落差进一步显现,各电网区域内部资源分布的不均衡性也进一步加深,见图4。

图4 第二类技术领域创新竞争力前20名高校布局情况Fig.4 Layout of top 20 universities in the second type of technological innovation competitiveness

3)第三类技术领域包括输变电设备运行与管理技术、输变电施工与设计技术、特高压输变电技术3个输配电相关领域。从电网区域分布情况来看,各电网区域间的优势科技资源分布较为平均,最具优势的仍是以江苏省为代表的华东电网。相较于前两类技术领域来说,华中电网在输配电类技术领域的资源优势有所增强,主要因为四川大学、重庆大学及西南交通大学在此领域的创新竞争力较强。以陕西省为代表的西北电网在此领域内的数量较少,但西安交通大学的创新竞争力十分强劲,在其中两个领域的排名均进入前三,因此带动了西北电网优势科技资源整体质量的上升,见图5。

图5 第三类技术领域创新竞争力前20名高校布局情况Fig.5 Layout of top 20 universities in the third type of technological innovation competitiveness

4)第四类技术领域包括电动汽车与储能技术、新材料及其应用技术、新能源发电与接入技术3个新兴技术领域。从电网区域分布看,各电网区域间的优势科技资源分布较为平均,华东、华北、华中电网实力相近且占据大部分资源。相较于其它类型技术来说,东北电网在新兴技术领域的资源优势有所增强,主要贡献来自哈尔滨工业大学、吉林大学、沈阳工业大学等老牌工科院校。从省级分布情况看,湖南省的优势增强,湖南大学在3个细分领域均排在前20名,湘潭大学在新材料技术及应用、新能源发电及接入技术领域进入前20,见图6。

图6 第四类技术领域创新竞争力前20名高校布局情况Fig.6 Layout of top 20 universities in the fourth type of technological innovation competitiveness

5)第五类技术领域为决策支持技术领域。从电网区域分布看,该技术领域的区域分布在所有类型中最不均衡,东北电网和西北电网仅占全国科技资源的15%,华东、华北、华中电网实力相近且占据更大部分的资源,其中华东电网的资源占全国的35%,见图7。

图7 第五类技术领域创新竞争力前20名高校布局情况Fig.7 Layout of top 20 universities in the fifth type of technological innovation competitiveness

4 结论与建议

以国内106所高校为研究对象,在利用TF-IDF技术进行文献归类的基础上,使用AHP-熵权法与TOPSIS法分别计算权重及评价分值,发现电工领域科技资源存在分布不均的问题,东西部区域高校的科技创新竞争力差距较大。各省需共同努力,合作互动、交流互通,实现优势互补,协力缩小区域间科技资源差距,共同为建设新型电力系统、实现电力行业能源转型贡献力量。

1)加强西部地区电力科技资源部署。从其科技资源的地理分布来看,主要集中于北京、江苏、湖北、陕西等中、东部发达地区,西北、西南地区电工领域科技资源较为稀缺。西北、西南地区拥有丰富的可再生能源,应加强对此类地区的资源注入,因地制宜开展可再生能源发电研究,助力我国电力行业的能源转型。

2)构建产学研合作模式。高校和科研机构是企业的人才基地,企业是技术的需求方,产学研链条的每一环节都应做到分工明确、信息互通、互促互济。高校可在现有学科基础上,协同地方资源禀赋与发展战略,逐步探索有自身特色且具备核心竞争力的技术领域,由点及面增强综合实力,构建高校与地方新能源企业整体对接的产学研合作模式。

3)促进高校信息化建设。一些高校的信息较少或更新较慢,不利于自身宣传展示及评价工作的展开,高校应重视对信息化平台的建设,促进信息公开透明。

猜你喜欢
电工竞争力电网
穿越电网
特变电工
特变电工
特变电工
糊涂的维修工
论外卖品牌的竞争力
日本竞争力
电网也有春天
“北上广深”pk城市竞争力
一个电网人的环保路