许明英 杜军平 梁美玉 薛哲 李昂
摘 要:针对科研团队精准立体画像构建的现实需求,本文提出了面向科技大数据的科研团队精准立体画像生成方法。该方法包含科研团队识别、科研团队研究主题预测、科研团队精准立体画像生成三个模块。基于迭代的中间中心度排名方法识别科研团队负责人,通过2-派系和滚雪球方法识别科研团队成员,实现科研团队的识别。综合考虑研究领域内科研团队研究主题间的交互影响,提出基于图注意力网络的主题融合的科研团队研究主题预测方法,通过建模相同研究领域的团队间的主题关联,提高科研团队的研究主题预测准确率。科研团队精准立体画像生成模块通过科研团队简介生成、科研合作关系构建、科研团队研究主题及主题趋势词云生成科研团队的精准立体画像。基于提出的方法在通信领域的科研成果数据集上识别出科研团队,预测科研团队的研究主题,生成科研团队精准立体画像并进行可视化展示,验证了所提方法的有效性。
关键词:科研团队;画像;团队识别;主题预测;图注意力网络
中图分类号:TP391文献标识码:A文章编号:2097-0145(2022)03-0015-08doi:10.11847/fj.41.3.15
Accurate Stereo Portrait Generation Method of Scientific Research Team
for Scientific and Technological Big Data
XU Ming-ying, DU Jun-ping, LIANG Mei-yu, XUE Zhe, LI Ang
(Beijing Key Laboratory of Intelligent Telecommunication Software and Multimedia, Beijing University of Posts and Telecommunications, Beijing 100876, China)
Abstract:In view of the practical demand of accurate stereo portrait construction of scientific research team, this paper proposes an accurate stereo portrait generation algorithm of scientific research team. The algorithm includes three modules: research team identification, research topic prediction and research team portrait generation. The leader of the scientific research team is identified based on the iterative middle centrality ranking method, and the members of the scientific research team are identified through the 2-faction and snowball methods, so as to realize the identification of the scientific research team. Considering the interaction between the research topics of the research team in the research field, a topic prediction method based on the topic fusion of the graph attention network is proposed to improve precision of topic prediction. The research team portrait generation module generates the accurate stereo portrait of the research team through the generation of the research team profile, the construction of research cooperation relationship, and the construction of the research team topic and trend cloud. Scientific research team is identified on the data set of scientific research achievements, and the accurate stereo portrait of scientific research team is generated and visualized. Experiments verify the effectiveness of the proposed method.Key words:scientific research team; portrait; team identification; topic prediction; graph attention network
1 引言
科研團队合作在许多科学研究领域已经变得势在必行,科学、技术和工程领域超过90%的成果是通过团队合作完成的[1]。随着科研任务的复杂化和专业化程度的提高,科研任务越来越倾向于由科研团队合作完成。科研团队合作有助于团队成员实现科研团队间的科技信息资源共享,获取和整合科技知识、技术和其他必要的科技资源,从而提升科技创新能力[2,3]。相关调研发现信息检索领域内高产的学者更乐于合作,而且更愿意和自己研究兴趣相似的人合作,科研团队合作与研究质量正相关[4]。
如何从浩如烟海的科技大数据中快速、准确地识别出科研团队,如何有效地刻画科研团队使团队信息更加直观地展示,为科研团队管理、评审专家决策提供科学的决策支持是科技大数据领域亟需解决的重要科学问题[5]。从海量科技大数据中有效地识别科研团队并对其进行分析[6,7]和刻画,有助于快速掌握科研团队现状,改善对科研团队的管理以及更好地引导科研团队的发展。目前针对科研团队画像的研究相对较少,莫君兰等[8]提出了科研团队画像的概念,通过融合多源异构数据构建科研团队画像。刘行兵等[9]使用AHP层次分析法,构建了体现科研团队协同创新能力的科研团队画像。现有的科研团队画像构建方法没有考虑对科研团队的研究主题未来趋势的刻画,无法帮助科学家和政府预见未来的研究方向,无法为科研管理部门提供决策支持。
本文提出了面向科技大数据的科研团队精准立体画像生成方法,该方法包括科研团队识别、科研团队研究主题预测、科研团队精准立体画像生成三个模块。科研团队识别模块通过获取科技大数据中相关研究领域的科研成果等科技资源,基于社会网络分析的思想[10,11],采用迭代的中间中心度排名方法识别出了团队领导人与团队成员[12]。科研团队研究主题预测模块通过分析各个研究领域的科研团队成果数据的特点[13~15],抽取科研团队的研究主题,提出基于图注意力网络(GAT)的科研团队主题融合方法预测科研团队的研究主题未来趋势。科研团队精准立体画像生成模块通过科研团队简介、科研团队合作关系图和科研团队研究主题及预测词云构建科研团队精准立体画像,对科研团队进行全面、立体地刻画。
本文的主要贡献如下:(1)提出了面向科技大数据的科研团队精准立体画像生成方法,通过科研团队识别、科研团队研究主题预测、科研团队精准立体画像生成三个模块构建科研团队画像。(2) 针对科研团队的科研成果数据,提出了一种基于图注意力网络(GAT)的主题融合的研究主题预测方法,提高了科研团队的主题趋势预测准确率。(3) 在科技成果数据集上进行了实验,挖掘出科研团队,精准地预测出了科研团队研究主题趋势,设计模板生成了科研团队精准立体画像。
2 相关工作
2.1 科研团队识别
利用大型科技文献数据构建科研合作网络,识别科研团队的方法得到了广泛的研究[16,17]。通过学术合作关系构建学术合作网络[18,19],通过社会网络分析法[20]识别科研团队[21]。通常使用作者合著、文献引用等信息构建整体科研合作网络[22],基于静态分析法分析科研合作网络的统计特征和合作成员的个人属性[23]。选择中间中心度作为识别团队负责人的指标,通过中间中心度指标排名,挖掘出科研网络中的团队负责人和合作密切的团队成员[24]。于永胜等[12]提出了基于迭代中间中心度方法,从而更准确地实现科研团队的识别与挖掘。
2.2 主题预测
Prabhakaran等[25]使用历史曲线上的时间分析来预测特定领域的研究主题的兴衰。Li等[26]利用机器学习方法对纳米材料生物医学领域的研究成果进行挖掘,科学地预测其研究领域的发展趋势。相关研究开始关注计算机科学领域的主题演化趋势预测,Tesfamariam等[27]采用经典的时间序列预测模型ARIMA预测计算机科学中国际会议的研究主题趋势。LSTM被用来捕获时序特征[28],并被用于科学研究主题预测任务。Liang等[29]使用科技出版物和科技期刊的相关数据,应用LSTM网络预测候选主题的流行度分数以确定未来的研究主题。
2.3 科研团队画像构建
对科研团队进行分析与刻画有助于改善对科研团队的管理。随着用户画像技术[30]的发展,融合多源异构数据的科研人员画像构建方法得到了广泛的研究[31,32],莫君兰等[8]通过融合多源异构数据构建包含团队结构抽取、团队紧密度提取、团队研究主题提取、团队影响力的科研团队画像。刘行兵等[9]使用AHP层次分析法,构建体现科研团队的协同创新能力的科研团队画像,通过科研团队绩效评价体系对科研团队的创新能力进行数字化。然而,现有的科研团队画像构建方法没有考虑科研团队的研究主题未来趋势的刻画。
3 科研团队精准立体画像生成方法的提出
针对科研团队精准立体画像构建的现实需求,提出了科研团队精准立体画像生成方法。科研团队精准立体画像生成方法的整体框架如图1所示。
科研团队精準立体画像生成方法包括三个模块:科研团队识别模块、科研团队研究主题预测模块、科研团队精准立体画像生成模块。科研团队识别模块对科技论文的作者列表进行处理,去除没有作者或作者机构不存在的数据,构建科研合著网络,使用基于社会网络分析法识别科研团队。使用迭代中间中心度方法识别出不同研究领域的科研团队负责人,通过2-派系和滚雪球方法识别科研团队成员的核心成员和非核心成员。科研团队研究主题预测模块采用基于图注意力网络的科研团队主题融合方法融合某科研团队受到的其他科研团队的主题影响,预测科研团队主题未来发展趋势。科研团队精准立体画像生成模块设计团队简介模板、团队合作关系图模板,对识别出的科研团队的信息进行统计分析,基于设计的模板形成团队简介;根据科研团队的科研成果的作者列表数据中作者的共现信息、科研团队成员的硕博士论文中的作者及指导教师信息,抽取科研团队负责人及团队成员之间的合作信息及师徒关系,构建团队合作关系图;生成科研团队的研究主题及主题预测词云,最终生成科研团队的精准立体画像。
3.1 科研团队识别
团队负责人是科研团队的核心和灵魂,科研团队负责人识别是科研团队识别的重要部分。采用于永胜等[12]提出的方法基于迭代的中间中心度排名方法识别科研团队负责人,通过2-派系和滚雪球方法识别科研团队成员,从而实现科研团队的识别与挖掘。科研团队识别算法的具体步骤如表1所示。
科研团队识别模块以学者合著列表为输入构建科研合著网络,计算科研合著网络中所有节点的中间中心度排名,选取出科研团队负责人,使用2-派系方法识别出与团队负责人相连的核心科研人员,以科研团队负责人和核心科研人员为基点通过滚雪球的方法识别出非核心科研人员。
3.2 基于图注意力网络的科研团队主题融合的主题趋势预测算法(GATP)
通过分析领域内科研团队成果数据的特性发现,团队的研究主题趋势会受到该领域内其他科研团队的研究主题的影响,因此提出了基于图注意力网络的科研团队主题融合的主题趋势预测算法(GATP),GATP算法框架图如图2所示。
图2 基于图注意力网络的科研团队主题融合的主题趋势预测框架图
给定某研究领域内多个科研团队的研究主题,为了追踪领域内每个团队的研究主题,通过部署多个循环神经网络LSTM对不同团队的研究主题序列进行建模,将每个研究团队的研究主题编码为多个低维的向量表示,区分不同科研团队的研究主题。采用基于图注意力网络的科研团队主题关联融合方法建模研究领域内科研团队之间的主题关联,获取领域内其他科研团队的研究主题对该科研团队的主题影响。给定一个科研团队在第t年及第t年之前的研究主题,基于图注意力网络的科研团队主题融合的主题趋势预测算法GATP,根据该科研团队在第t年及第t年之前的研究主题和领域内其他科研团队对该科研团队的主题影响预测该科研团队在t+1年的研究主题。
3.2.1 基于LSTM的科研团队主题序列建模
对于科技大数据某领域包含n个团队的科技论文集P={p1,p2,…,pn},pi代表了一个团队的科技论文集合,抽取团队中主题词集
{w1,w2,…,wj,…,wv}。应用one-hot向量pti∈Rv表示团队i在第t年的研究主题,
pti={pt1,pt2,…,ptj,ptv},ptj表示主题词wj的归一化词频,v是出现在科技论文集P中的词汇。ptj的计算公式如(1)式所示。
ptj=tf(wj)∑si=1tf(wj)(1)
其中tf(wj)是主题词wj在团队pi中出现的词频,s是团队pi中所有主题词的数目。
为了追踪领域内每个团队的研究主题,区分不同团队的研究主题表示,部署了多个LSTM对不同团队的研究主题序列进行建模。以当前时间步长的研究主题为输入,将研究主题迭代编码为隐藏状态,以捕获不同团队的研究主题。团队的主题序列由带有不同参数的多个LSTM链建模。
假设某一研究领域下有四个团队:团队i,团队j,团队k和团队l。给定团队i的研究主题pi={p1i,p2i,…,pti},pti是团队i在第t年的研究主题,pti∈Rv。为了避免词汇量增加时的维数灾难,部署词嵌入矩阵,将pti转换成稠密低维的向量。团队i第t年的研究主题表示为xti。xti的计算公式如(2)式所示。
xti=pti(2)
其中是词嵌入矩阵,∈Rdw×v,xti∈Rdw。
将xti作为输入,使用LSTM建模研究团队i在第t年的研究主题表示hti。hti的计算公式如(3)式所示。
hti=LSTM(ht-1i,xti)(3)
3.2.2 基于图注意力网络的主题影响力融合
对于领域内的某一团队,其研究主题会随着领域内其他团队主题的影响而发生变化。除了跟踪团队内的研究主题外,还需要计算领域内其他团队的研究主题对该团队主题演变的科学影响。团队之间主题的交互影响被建模为图,通过部署图注意力网络获得其他团队对该团队的主题影响。给定科研团队在第t年的研究主题表示hti,htj,htk,htl。将它建模为图G=(V,E)。其中V表示團队的集合,即hti,htj,htk,htl。E是边的集合,每条边表示团队的研究主题间的交互影响。
团队i的主题影响h_GATti聚合了其他团队的研究主题,团队i的主题影响计算公式如(4)和(5)式所示。
eij=aT([Whti]‖[Whtj])(4)
h_GATti=σ(∑j∈Niexp(Relu(eij))∑k∈Niexp(Relu(eik))·Whtj)(5)
其中W是线性变换权重矩阵,a是注意力权重向量。Ni是与团队i在同一领域的其他团队。
3.2.3 科研团队的研究主题趋势预测
连接领域内科研团队i的主题表示hti和领域内科研团队i的主题影响h_GATti,将其输入softmax预测器,得到科研团队i在第t+1年预测主题词的分布t+1i,计算公式如(6)式所示。
t+1i=softmax(Wo[hti;h_GATti]+bo)(6)
使用归一化多项式逻辑损失作为损失函数,最小化预测主题词分布t+1i和目标主题词分布pt+1i的KL散度。损失函数和KL散度的计算公式如(7)和(8)式所示。通过最小化一个领域内所有科研团队的研究主题序列的损失来实现科研团队的主题预测最优化。
loss=∑s∈{i,j,k,l}∑Tt=1KL(t+1s‖pt+1s)(7)
KL(t+1s‖pt+1s)=∑jt+1s,jlog
t+1s,jpt+1s,j(8)
3.3 科研团队精准立体画像生成方法
科研团队精准立体画像包含三部分:科研团队简介、团队合作关系图构建、科研团队研究主题预测。为每个部分设计了模板,科研团队简介模板主要包括科研团队总人数、科研团队的主要研究领域、团队负责人主持项目数、团队项目总数、发表论文总数、被引用次数、团队发表的会议论文数、期刊论文数;团队合作关系图模板包括团队负责人与科研团队之间的合作关系以及之间的师徒关系、团队成员所属机构及学科;研究团队主题模板将科研团队研究主题及主题趋势以主题词云的形式展示。
科研团队识别模块识别出科研团队负责人及科研团队成员的基本信息,包含科研团队人员的姓名、所属机构、研究方向、团队负责人及团队成员的主持基金信息、科研论文成果、论文被引信息。统计分析科研团队的基本信息生成科研团队简介,通过团队负责人及团队成员的硕博论文信息挖掘科研团队负责人及成员之间的合作关系及师徒关系。基于科研团队研究主题预测出科研团队的研究主题未来趋势,通过科研团队研究主题及主题趋势生成研究主题及主题趋势词云图。综合科研团队简介、科研团队合作关系图、科研团队研究主题及主题趋势,生成科研团队精准立体画像。
4 实验验证分析
4.1 数据集
搜集从2011年到2020年10年间通信领域的科技论文44164篇作为实验数据集。每条数据包括科技论文的标题、摘要、所属项目名称、作者、作者所在的单位等字段。获得的数据如果存在无效数据的问题,如无作者、单作者论文数据,则将此类数据删除,删除无效数据后,剩余有效的科技论文43242篇。科研团队识别的前提是对作者数据进行消歧,而作者消歧需要与机构数据结合,对机构数据进行清洗,对作者数据进行清洗。获取的数据中作者信息包括中文作者及英文作者,对于英文数据采取作者名字、机构与中文数据进行对齐的方式将其转化为统一的中文作者以方便后续处理。
4.2 科研团队识别
构建整体科研合著网络。从整体合著网络中提取出作者发文量最小阈值为10、作者合著频次最小阈值为5的合著网络作为初始科研合著网络,计算所有节点的中间中心度排名,选取出排名最高的学者作为科研团队负责人。将该学者从合著网络中删除,继续计算中间中心度排名,基于迭代的中间中心度排名方法通过反复迭代选择团队负责人,通过循环计算中间中心度值排名,每次只抽取排名最高的节点作为团队负责人,然后从网络中剔除该节点,继续进行迭代计算,直到剩下节点的中间中心度值不大于1,获得较好的科研团队负责人识别结果。
以基于迭代的中间中心度方法识别出的科研团队负责人作为基点,在初始合著网络中选取与团队负责人有合著关系的结点集合,利用2-派系方法在整体科研合著网络中识别出团队的核心科研人员,在整体合著网络中以科研团队的团队负责人、核心成员的各个作者为顶点,使用滚雪球的方式向下滚动一层,获得该科研团队的非核心成员。识别出了5个科研团队并统计了5个科研团队的详细信息如表2所示。表2给出了识别出的5个科研团队中每个团队的团队人数、研究领域、团队项目数、发表论文数、被引次数、师徒关系对数。
4.3 科研团队研究主题预测的有效性分析
将基于图注意力网络的科研团队主题融合的主题趋势预测算法GATP与经典的时间序列预测方法ARIMA[33]、基于递归神经网络的研究主题预测方法LSTM、DARNN[34]、DSTP[35]进行比较。采用时间序列预测任务中的评价指标RMSE、precision@n(简记为p@n,n表示预测的主题词的数目)对主题预测性能进行评价。表3~表5给出了GATP算法及其对比算法在识别出的5个科研团队上的RMSE值、平均RMSE值、主题预测准确率、主题预测平均准确率。
表3是提出的基于图注意力网络的科研团队主题融合的主题趋势预测算法GATP和对比的预测方法在识别出的通信领域的5个科研团队的科研成果数据集上的主题预测性能RMSE值和平均RMSE值。从表中可以看出,经典的主题预测算法ARIMA的主题预测性能RMSE值和平均RMSE值是最大的,基于循环神经网络的主题预测模型LSTM、DARNN和DSTP的主题预测性能RMSE值和平均RMSE值低于ARIMA。GATP在所有科研团队上的RMSE值和平均RMSE值都是最小的。这说明提出的方法通过模型的训练将预测的主题词分布无限与科研团队的目标主题词分布逼近,实现了主题预测性能RMSE值的最小化。
表4是提出的基于图注意力网络的科研团队主题融合的主题趋势预测算法GATP和对比的主题预测方法在科研团队1、2、3上的主题预测准确率。从表4可以看出,提出的主题预测算法GATP的主题预测准确率超过了经典的预测模型ARIMA以及基于循环神经网络的主题预测模型。基于循环神经网络的主题预测模型LSTM、DARNN、DSTP方法在科研团队1上的主題预测准确率高于ARIMA的主题预测准确率,而在科研团队2、3上的主题预测准确率比ARIMA的预测准确率低。说明基于循环神经网络的主题预测模型LSTM、DARNN、DSTP在科研团队1、2、3上的主题预测性能不稳定,不适合科研团队1、2、3的主题预测。GATP算法在科研团队1、2、3上都达到了最好的预测性能。
表5是GATP算法和比较的主题预测方法在科研团队4、5的主题预测准确率和在5个团队上的平均预测准确率。表5的实验结果显示了与表4类似的趋势。基于神经网络的主题预测方法LSTM、DARNN、DSTP在科研团队4、5上的预测准确率不如ARMIA。通过表4与表5的实验结果得出结论,基于循环神经网络的主题预测方法LSTM、DARNN、DSTP在各个科研团队的主题预测准确率是不稳定的。GATP实现了最好的主题预测性能,而且稳定性较高,说明提出的GATP主题预测方法,通过部署图注意力网络融合相同研究领域内其他团队对某团队的主题影响,实现了团队主题的主题趋势预测,表现出了最佳的主题预测性能,验证了所提方法的有效性。
5 科研团队精准立体画像生成
选择识别的科研团队1,构建该团队的精准立体画像。获取该团队的团队负责人及团队成员的信息,基于该科研团队的统计信息,形成团队简介。生成科研团队1的团队简介为:团队共5人,主要研究领域为通信与信息系统。该团队负责人主持项目5项,团队项目数12项,发表论文420篇,论文被引用576次。团队共发表会议论文96篇,期刊论文302篇。基于该科研团队的统计信息,获取团队成员间的指导关系,构建科研团队合作关系图。基于科研团队主题预测模块从该科研团队的科研成果中抽取研究主题,形成研究主题词云,采用提出的GATP算法预测科研团队的主题趋势,形成主题趋势词云。科研团队合作关系图和科研团队研究主题词云图如图3和图4所示。
科研团队合作关系图展示了团队负责人与科研团队成员之间的合作关系以及之间的师徒关系,并展示了科研团队负责人及科研团队成员所属的机构及学科。科研团队研究主题词云图展示该科研团队的研究主题及未来研究主题趋势。
6 结论与启示
本文针对科研团队精准立体画像构建的现实需求以及现有的科研团队画像的研究现状,围绕科研团队识别、科研团队研究主题预测、科研团队精准立体画像生成,提出了面向科技大数据的科研团队精准立体画像生成方法。在科研团队的研究主题趋势预测方面,科研团队的研究主题趋势受该团队的研究主题的影响以及相同领域其他科研团队的研究主题的影响,因此在预测科研团队的研究主题时,提出了基于图注意力网络的科研团队主题融合的主题趋势预测算法,通过融合其他团队主题的关联信息,提高了科研团队研究主题预测的准确性。在科研团队画像构建方面,抽取了科研团队的研究主题,将科研团队的研究主题及主题趋势通过词云的方式展示出来,进而为科研管理部门提供项目决策支持。
參 考 文 献:
[1]Yao X, Zhang C, Qu Z. Global village or virtual balkans? Evolution and performance of scientific collaboration in the information age[J]. Journal of the Association for Information Science and Technology, 2020, 71(4): 395-408.
[2]Li W, Jia Y, Du J. Variance-constrained state estimation for nonlinearly coupled complex networks[J]. IEEE Transactions on Cybernetics, 2017, 48(2): 818-824.
[3]Meng D, Jia Y, Du J, et al.. High-precision formation control of nonlinear multi-agent systems with switching topologies: a learning approach[J]. International Journal of Robust and Nonlinear Control, 2015, 25(13): 1993-2018.
[4]Lariviere V, Desrochers N, Macaluso B, et al.. Contributorship and division of labor in knowledge production[J]. Social Studies of Science, 2016, 46(3), 417-435.
[5]王伟.基于学术大数据的科学家合作行为分析与挖掘[D].大连:大连理工大学,2010.
[6]Wei X, Du J, Liang M, et al.. Boosting deep attribute learning via support vector regression for fast moving crowd counting[J]. Pattern Recognition Letters, 2019, 119: 12-23.
[7]Meng D, Jia Y, Du J, et al.. Stability analysis of continuous-time iterative learning control systems with multiple state delays[J]. Acta Automatica Sinica, 2010, 36(5): 696-703.
[8]莫君兰,窦永香,开庆.基于多源异构数据的科研团队画像的构建[J].情报理论与实践,2020,43(9):100-106.
[9]刘行兵,翟亚超,柴斌,等.基于 AHP 模型的协同创新科研团队画像的构建[J].科技管理研究,2021,(19):136-140.
[10]Kou F, Du J, He Y, et al.. Social network search based on semantic analysis and learning[J]. CAAI Transactions on Intelligence Technology, 2016, 1(4): 293-302.
[11]Kou F, Du J, Yang C, et al.. Hashtag recommendation based on multi-features of microblogs[J]. Journal of Computer Science and Technology, 2018, 33(4): 711-726.
[12]于永胜,董诚,韩红旗,等.基于社会网络分析的科研团队识别方法研究——基于迭代的中间中心度排名方法识别科研团队领导人[J].情报理论与实践,2018,41(7):105-110.
[13]Zhao H, Liu Q, Zhu H, et al.. A sequential approach to market state modeling and analysis in online p2p lending[J]. IEEE Transactions on Systems, Man, and Cybernetics-Systems, 2017, 48(1): 21-33.
[14]Sun B, Du J, Gao T. Study on the improvement of k-nearest-neighbor algorithm[A]. The 2009 International Conference on Artificial Intelligence and Computational Intelligence[C]. IEEE, Shang Hai, 2009. 390-393.
[15]Hu W, Gao J, Li B, et al.. Anomaly detection using local kernel density estimation and context-based regression[J]. IEEE Transactions on Knowledge and Data Engineering, 2018, 32(2): 218-233.
[16]Liang Y, Jia Y, Du J, et al.. Vector field guidance for three-dimensional curved path following with fixed-wing UAVs[A]. The 2015 American Control Conference[C]. Institute of Electrical and Electronics Engineers Inc, 2015. 1187-1192.
[17]Meng D, Jia Y, Du J. Multi-agent iterative learning control with communication topologies dynamically changing in two directions[J]. IET Control Theory & Applications, 2013, 7(2): 261-270.
[18]Cao J, Mao D, Cai Q, et al.. A review of object representation based on local features[J]. Journal of Zhejiang University Science, 2013, 14(7): 495-504.
[19]Meng D, Jia Y, Du J. Stability of varying two-dimensional roesser systems and its application to iterative learning control convergence analysis[J]. IET Control Theory & Applications, 2015, 9(8): 1221-1228.
[20]Kou F, Du J, Lin Z, et al.. A semantic modeling method for social network short text based on spatial and temporal characteristics[J]. Journal of Computational Science, 2018, 28: 281-293.
[21]Chen W, Li Y, Yu J. Construction and evaluation of the safety risk factors of the urban utility tunnel based on the social network analysis[J]. Journal of Safety and Environment, 2020, 20(5): 1652-1660.
[22]王曰芬,楊雪,余厚强,等.人工智能科研团队的合作模式及其对比研究[J].图书情报工作,2020,64(20):14-21.
[23]Xue Z, Du J, Du D, et al.. Deep low-rank subspace ensemble for multi-view clustering[J]. Information Sciences, 2019, 482: 210-227.
[24]李纲,李春雅,李翔.基于社会网络分析的科研团队发现研究[J].图书情报工作,2014,58(7):63-70.
[25]Prabhakaran V, William L, McFarland D. Predicting the rise and fall of scientific topics from trends in their rhetorical framing[A]. Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics[C]. Association for Computational Linguistics, Berlin, 2016. 1170-1180.
[26]Li Y, Pu Q, Li S, et al.. Machine learning methods for research highlight prediction in biomedical effects of nanomaterial application[J]. Pattern Recognition Letters, 2019, 117: 111-118.
[27]Tesfamariam M, Yemisrach G, Sergey V. Towards predicting trend of scientific research topics using topic modeling[A]. Proceedings of the 7th International Young Scientist Conference on Computational Science[C]. Elsevier B.V., 2018. 304-310.
[28]Lu Z, Tan H, Li W. An evolutionary context-aware sequential model for topic evolution of text stream[J]. Information Sciences, 2019, 473: 166-177.
[29]Liang Z, Maoa J, Luc K, et al.. Combining deep neural network and bibliometric indicator for emerging research topic prediction[J]. Information Processing & Management, 2021, 58(5): 1-18.
[30]张壮,冯小年,钱铁云.基于多模态融合技术的用户画像方法[J].北京大学学报,2020,56(1):105-111.
[31]袁莎,唐杰,顾晓韬.开放互联网中的学者画像技术综述[J].计算机研究与发展,2018,55(9):1903-1919.
[32]顾晓韬.开放互联网中的研究者画像[D].北京:清华大学,2017.
[33]Hadi A, Amin K, Orkun K. ARIMA-based decoupled time series forecasting of electric vehicle charging demand for stochastic power system operation[J]. Electric Power Systems Research, 2016, 140: 378-390.
[34]Qin Y, Song D, Chen H, et al.. A dual-stage attention-based recurrent neural network for time series prediction[A]. Proceedings of the 26th International Joint Conference on Artificial Intelligence[C]. International Joint Conferences on Artificial Intelligence Press, Melbourne, VIC, 2017. 2627-2633.
[35]Qin Y, Chen D, Xiang S, et al.. Gated dual attention unit neural networks for remaining useful life prediction of rolling bearings[J]. IEEE Transactions on Industrial Informatics, 2020, 17(9): 6438-6447.