数据挖掘与智能筛选视角下的科技期刊选题策划

2020-04-07 17:48蒋学东涂鹏阳丽霞
出版科学 2020年1期
关键词:科技期刊大数据人工智能

蒋学东 涂鹏 阳丽霞

[摘 要] 针对科技期刊传统选题策划面临的数据有限、信息精准度不高及以编辑经验为主的问题,探究大数据和人工智能背景下的选题策划优化方法。通过分析大数据和人工智能背景下科技期刊选题策划面临的挑战,结合大数据和人工智能为选题策划优化在数据、算力和算法三个层面提供的理论、方法和技术,探究科技期刊选题策划各关键环节的优化方法。以期运用大数据的智能自动化人机协作功能,科学配置大数据资源,使科技期刊的选题策划决策建立在大数据科学描述、预测和诊断的基础之上,达到科技期刊选题策划的科学化、自动化和精准化。

[关键词] 大数据 人工智能 科技期刊 选题策划优化

[中图分类号] G232[文献标识码] A[文章编号] 1009-5853 (2020) 01-0036-06

Topic Selection Planning of Scientific Journals from the Perspective of Data Mining and Intelligent Screening

Jiang Xuedong Tu Peng Yang Lixia

(Editorial Department of Journal of Railway Science and Engineering, Central South University, Changsha, 410075)

[Abstract] Aiming at the problems of limited data, low accuracy of information and too much dependence on editors experience in the traditional topic selection and planning of sci-tech periodicals, this paper probes into the optimization methods of topic selection and planning under the background of big data and artificial intelligence. This paper first analyzes the challenges faced by the topic selection and planning of sci-tech periodicals under the background of big data and the artificial intelligence. Then, it explores the optimization methods for the key parts of topic selection and planning of sci-tech periodicals combining the theoretical methods and technologies provided by big data and artificial intelligence at the level of data, calculation power and algorithm. The goal of optimization of topic selection and planning is expected to be achieved by using the intelligent automatic man-machine collaboration function of big data and scientifically configuring the resources of big data. Based on the scientific description, prediction and diagnosis of big data, the selection and planning decisions of sci-tech periodicals would be more scientific, automatic and precise.

[Key words] Big data Artificial intelligence Sci-tech periodical Optimization of topic selection

科技论文的质量是科技期刊强大生命力的保证,选题策划是科技期刊吸引高质量科技论文、扩大自身影响力的前提。选题策划作为科技期刊出版流程的源头,其创新程度直接决定后续所有流程的效果。科技期刊选题的精准程度不仅影响科技期刊自身的创新发展和品牌质量,更在一定程度上影响整个行业乃至国家科技界的创新速度与进程。随着信息技术的高速发展和数据信息交互、共享与开放程度的持续加快,大数据已成为数据化时代与货币、黄金等同等重要的新经济资产。在科研领域,大数据正引领第四科学范式——数据密集型科学(Data-Intensive Science)的到来,并逐步推动传统科学的假设驱动模式向基于大数据探索的数据密集型方法转变[1]。在世界各國均已逐步将大数据和人工智能作为国家基础性战略资源的背景下,我国相继出台了《促进大数据发展行动纲要》和《新一代人工智能发展规划》,大数据和人工智能被正式列入国家级战略层面,成为我国未来提升国际竞争力的主要手段[2]。作为科学技术信息传播主力军的科技期刊,在大数据和人工智能双驱动不断加速的今天,更应尽快在科技信息传播的各个环节高效应用大数据和人工智能,不断优化资源配置,加强人机协作,凸显大数据基础上描述、预测、诊断和决策的智能自动化,以大数据和人工智能技术带来的科学化、自动化和精准化推进科技期刊选题策划的高质量发展,为我国第一生产力的创新、迭代和引领增加强劲动力。

1 科技期刊选题策划现状

科技期刊的选题策划是编辑人员依据一定的方针和主客观条件,开发科技研究出版资源、设计选题的创造性活动,是编辑工作与出版工作之“本”。选题策划决策的优劣直接影响科技期刊的质量和行业影响力,在科技期刊所有工作中有着举足轻重的地位。大数据时代科技期刊需求侧的在线化、数字化、多元化、碎片化的需求日益加速, 在一定程度上反向倒逼了作为供给侧的科技期刊在前向供应链上的在线化、数字化和多元化调整。

现有传播环境下的科技期刊选题策划,数据化和智能自动化程度不高,经验为主的传统选题策划模式依旧占有较大比重。传统的选题策划方式常以编辑征求专家或期刊编委意见、参加学术会议、关注基金项目、统计作者和读者问卷调查结果、向一线研究人员了解行业发展动态等为主。这些选题策划方式往往因速度较慢、获取数据有限、信息精准度不高、编辑劳动重复繁琐等原因导致选题策划在时效性、前沿性、延续性、集聚效应、精准度匹配等方面无法实现预期目标,其大成本投入与生产服务效率严重不匹配,最终对科技期刊信息传播的内容、过程、效果和传播主体的积极性、创造性等各方面都造成了严重影响。

2 大数据和人工智能背景下,科技期刊传统选题策划方式面临的挑战

2.1 传统选题策划面临如何发现交叉学科和新兴领域的挑战

随着互联网的普及、科学技术创新加速和交叉学科的不断涌现以及新兴领域的兴起,传统的期刊编辑因语言不通、专业隔阂等使得其对研究领域前沿问题和热点问题的把握容易出现偏差,难以继续凭有限的个人经验实现选题策划科学决策。与此同时,约稿对象和审稿专家的精准定位与沟通方式也已发生了巨大变化。“内容为王”是科技期刊发展的永恒主题,如何利用大数据和人工智能的技术和已有研究成果揭开交叉学科和新兴领域等内容“皇帝”的隐形新装,打破专业领域的隔阂、突破时空的界限,通过将领域专家知识地图、研究机构成果地图、领域术语关联地图等有效结合并运用于科技期刊选题策划,抓住交叉学科和新兴领域这颗王冠上的明珠,实现决策计划与执行人的精准统一便成为数据时代科技期刊选题策划急需解决的一个重要问题。

2.2 传统选题策划面临策划内容与受众需求适应性的挑战

科技期刊的选题策划须在现有领域研究现状基础上围绕受众需求最大限度地发挥创造力和能动性。在互联网迅速发展的今天,受众需求呈现出明显的个体差异且快速变化的特点。科技期刊的受众既有读者,也有作者,而受众对于科技期刊选题策划的认可度对期刊的品牌建设和质量提升有着决定性作用。作为信息供给侧源头的科技期刊选题策划如果不能及时响应受众需求,实现与受众高强度的关联互动,为受众及时提供增值、创新和深层次的个性化体验,则可能面临信息传播无效乃至被受众背弃的严重后果。近年来我国部分领域研究成果外流、科技期刊冲击世界一流期刊屡屡受挫、部分期刊甚至出现稿源不足等情况都在一定程度上说明了选题策划面临的这一问题。在人人都是传播者的今天,选题策划“受众中心”的执行力度和效度对科技期刊的信息传播力影响尤为明显,优秀的选题策划能使科技期刊发展進入良性循环并逐步跨入强者恒强的加速轨道,不好的选题策划则可能让弱者卷入恶性循环最终走向不复存在的深渊。因此,大数据时代的科技期刊需格外重视基于“受众思维”的选题策划,从源头上杜绝恶性循环。

2.3 传统选题策划面临数据挖掘清洗及人工智能筛选的挑战

全媒体时代数据的关联性增强、不确定性增大、数据载体多样化和数据增量指数化等对于期刊编辑凭个人原有的经验和有限的知识来策划选题构成了前所未有的挑战。不借助数据清洗挖掘技术和人工智能技术,编辑部有限的人力无法应对数据的极速增长,科学降噪和归类利用大数据更无可能。如何充分挖掘大数据这一宝藏并利用人工智能完成多源数据的自主流动、合理配置,实现选题策划的科学性、前沿性、时效性和创造性是大数据智能时代科技期刊信息传播亟需解决的急迫问题[3]。

3 大数据和人工智能背景下科技期刊选题策划的优化目标

大数据和人工智能背景下的科技期刊选题策划工作,要在时效性、科学性、前沿性、可操作性和集聚效应等方面树立品牌抢占先机,就必须在数据、算力和算法等方面充分利用人工智能技术挖掘相关数据价值[4],解决大数据的不良影响因素,逐步提升算力、优化算法,努力实现决策阶段的高度自动化与智能化。

随着大数据和人工智能的迅猛发展,其理论、方法和技术为科技期刊选题策划提供了三个层面的优化目标。第一层面为数据层面的优化目标,即针对全媒体传播开发数据收集渠道和伪数据甄别系统,利用大数据技术和人工智能技术实现科技期刊选题策划相关研究领域科学真实的数据资源泛化收集。第二层面为算力层面的优化目标,即对第一层面收集来的数据资源进行精确分析。随着大数据和人工智能的蓬勃发展,针对大数据体量庞大且日增量巨大,不确定性高,关联度和可信度低等影响因素,研究者们提出了模糊集、粗糙集和三支决策理论等方法,为科技期刊选题策划有效进行大数据的精确分析提供了强有力的技术和理论支撑。第三层面的优化目标为数据分析结果的可视化展现,即算法层面的优化目标。这一层面应围绕选题策划优化模型的构建,在研究前沿探测、专家知识地图绘制、研究成果可视化呈现及新兴领域识别遴选等方面下足工夫,充分挖掘大数据价值,通过智能自动与人机协作结合,努力实现选题策划的高度自动化、智能化和精准化。大数据和人工智能在数据、算力和算法层面赋能科技期刊选题策划优化的关键环节,能使已有研究成果大数据资源和受众情况得到泛化收集和精确分析,并在此基础上通过及时发现交叉学科、精准探测研究前沿,预测科技期刊发展方向,绘制研究成果地图,优化专家知识地图构建,最终推动选题策划的高质量发展。基于已有的大数据和人工智能技术,优化科技期刊选题策划关键环节的简要框图如图1所示。

4 基于大数据和人工智能技术的科技期刊选题策划优化方法

基于大数据和人工智能技术的科技期刊选题策划,从数据收集、分析、预测、诊断到决策,都建立在大数据基础之上,以数据、算力和算法为支点,以智能自动化+人机协同为主要工作模式,围绕选题策划优化目标,以数据科学、人工智能引领优化互相关联的各要素,准确探测研究前沿、识别新兴领域、构建专家知识地图、可视化呈现已有研究成果和受众数据分析结果。基于大数据和人工智能技术的选题策划优化模型如图2所示。

4.1 选题策划之研究前沿探测优化

科技期刊选题策划中,泛化收集多源大数据并运用云计算、边缘计算和其他相关算法,以更全面关注研究机构成果、探测专业和交叉领域研究前沿、识别其演变路径非常关键。以某专业领域最新文献簇作为前沿探测基础,通过分析高频词、共现聚类的关键词和数据流等在特定学科热点和前沿主题研究中的应用,采用专家咨询法评估研究结果的相关性,可初步探测特定学科的研究热点和前沿主题[5]。通过追踪、收集、分析高产研究机构的研究方向、整体实力、所处地位、合作对象及其差异等方面的数据,了解不同机构在研究领域、研究成果、前沿识别、认可度等方面的基本状况,并根据不同高产机构的研究前沿成果调整选题策略,结合自身的定位和受众情况有的放矢规划选题。也可根据主要国家(地区)研究前沿及侧重从内容到时间分布上的特点及其与全球整体研究前沿的对比结果,判别出其在引领、同步与追赶全球趋势过程中所处的不同位置及其发展走向,从而探测到研究前沿的成果分布状况和基本走向[6]。只有利用大数据和人工智能技术实现研究领域的点面兼顾,才能保证科技期刊研究前沿探测的精准性和科学性。

4.2 选题策划之新兴研究领域发现优化

随着学科交叉的不断深入和互联网的不断发展,新兴领域、新型研究主题的出现频率和传播速率都在急剧提升。对新兴研究领域的准确和及时把握是新一轮科技革命中赢得主动的关键之举。通过对相关领域专家发表的科技论文、专著等大数据进行清洗、挖掘和筛选,利用科学计量学和统计学方法,探究相关学科领域的内在联系,探索学科交叉和新兴领域发展趋势的规律和特点,有助于我们理解新兴领域形成与演进的机理,准确把握其发展趋势,进而探测到领域内新兴的主题和研究方向[7]。利用主题统计模型、新兴技术跨领域扩散机理模型、文献耦合、共词方法、自然语言处理技术和基于引文的主路径分析等方法,从自由文本数据中识别有重要意义的研究主题(词语),可高效精准探测交叉学科和新兴领域,对科学进行科技期刊选题策划起到“仰望星空”的效果,为国家交叉学科发展的战略部署提供重要的决策支撑。

4.3 选题策划之专家知识地图构建优化

选题策划既要找准研究前沿方向、考虑领域核心知识,还需结合作者和审稿专家来源考虑专家识别和评价等问题。构建融合领域专家的识别和评价、快速掌握领域核心知识及其研究者的专家知识地图,对于科技期刊选题策划优化具有很强的现实应用价值[8]。随着数据源的增多和数据量的暴涨,通过传统模式了解和利用专家个人知识信息、领域专家关联信息等显性知识和隐性知识的全面数据已经非常困难。在选题策划和约稿环节如何利用大数据和人工智能技术有效挖掘与研究前沿相关的作者和审稿专家信息,构建专家知识地图,也是这一时代背景下科技期刊选题策划优化得以顺利实行的必要条件。为便于实现现有数据的合理挖掘,先将专家知识地图构建分为专家合作关联层和领域术语关联层,再将专家与领域知识连接起来,通过构建专家与专家、领域术语与领域术语、专家与领域术语这三种关联,建立领域专家知识地图的基础模型[9]。准确的专家知识地图构建能使选题策划成为有源之水,有本之木。只有实现科技期刊选题与约稿对象、审稿专家的快速精准匹配,才能保证科技期刊选题策划在描述、预测、决策、实施各个环节的科学、精准、有序。

4.4 选题策划之研究成果可视化呈现优化

研究成果可视化呈现可以将纷繁芜杂的多源科学数据转换成图形或图像显示出来,有利于选题策划的数据分析和方向决策在更直观、明了的条件下科学高效完成[7]。将可视化分析方法应用于选题策划数据管理,主要是依据科研数据自身的数据特征,基于元数据模型的多维数据分析方法,通过数据收集、预处理,分析计算进一步挖掘数据潜在的关联信息,并利用科研数据、基于关键词和共词分析的研究热点可视化方法和技术,结合基于推荐算法的可视化历史浏览方法,设计实现基于信息可视化的选题策划数据分析平台,以实现科研数据获取、基础数据录入和科研成果统计分析等多项功能的可视化管理和维护,为选题策划的最终决策提供可视化分析结果。目前,通过网络引文分析软件(Citespace)进行文献计量学研究是当前科技研究成果数据分析可视化的主要方式。该方式在研究搜索引擎技术的基本原理、核心爬虫技术和网页爬取处理流程的基础上,设计并实现科研成果搜索引擎的信息采集模块、爬虫爬行模块、信息索引模块、查询结果检索模块和用户交互模块的归一化,能让人机协作的科技期刊选题策划智能决策更便捷、直观、高效。

4.5 选题策划之受众数据收集与分析优化

选题策划的“受众思维”,是指在科技期刊策划环节以受众的需求为中心,围绕受众需求打造出能满足受众个性化体验并为受众提供增值、创新化、深层次的服务和产品。相较于受众只能被动接受信息的传统媒体时代,在大数据全媒体时代能否准确把握“受众思维”,是科技期刊信息传播能否顺利进行需解决的一个重要课题。科技期刊的受众既包含读者也包含作者。全媒体时代的到来为受众提供了非常灵活宽泛的多樣化选择,受众之间以各种不同的网络合作方式传播思想、共同创造、协作共享、产销合一的情况也越来越明显。在科技期刊选题策划各环节(选题、约稿、组稿、调研反馈等),传统的选题策划更多以编辑自身的经验和知识来决定选题和稿件的取舍,受众信息及其需求在这个环节难以体现。但在大数据全媒体时代,受众的数字化、在线化、碎片化、个性化需求不断提高,智能化的“以受众为中心”的组织架构和服务流程便应放在科技期刊选题策划最重要的位置。若不能及时树立以“受众”为中心的办刊理念,选题策划流产的可能性就会很大。结合全媒体时代的受众特征,科技期刊应根据自身定位和现实状况,结合大数据受众分析结果,将受众科学合理地分组并针对不同特征的受众群组成立灵活多样的受众体验联盟,利用大数据和人工智能进行受众体验预期、在线交互习惯、研究兴趣、创造能力等不同方面的数据收集与分析,从而及时精准地感知受众需求、诊断受众的难点与痛点,然后在选题策划的各个环节以满足受众需求为引领、以解决受众难点与痛点为目标,挖掘大数据中与受众密切相关的信息,打造接口透明、智能驱动、网络协同、客户体验、在线交互、群体创造的智能化组织[10],通过大数据和人工智能双驱动下的网络协同、人机协作和在线交互加强科技期刊与受众的交流,收集受众反馈的信息并根据其建议和意见不断改进选题策划及其后续各项工作的质量,通过人与人、人与组织、组织之间各个维度的数字化和智能化,充分激发选题策划及后续工作各方的积极性与创造力,真正为受众提供内容质量高、表现形式丰富、参与体验好、附加价值高的数字化科技信息服务和产品。

5 结 语

在人工智能快速发展的大背景下,大数据的应用前景已受到世界各国的高度关注。如何利用人工智能新技术挖掘、清洗和筛选大数据背后的巨大价值是数据科学时代各国综合国力比拼的一个重大课题。一系列针对多源异构大数据智能化处理的新方法、新模型、新趋势的出现,对于科技期刊利用大数据实现选题策划优化乃至智能决策有着非同一般的历史意义和现实意义。科技期刊作为国家科学技术信息传播的主要媒介,其在大数据和人工智能时代能否利用新技术完成数据收集、分析、诊断预测的智能自动化和人机协作化,科技期刊的选题策划是否科学、前沿、高效,对期刊能否打造自有品牌乃至占领科技信息传播的制高点有着关键的作用。

注 释

[1][美]托尼·亨,斯图尔特·坦斯利,克里斯汀·特勒著;潘教峰,张晓林译.第四范式:数据密集型科学发现[M].北京:科学出版社,2012:126-157

[2]国务院.国务院关于印发新一代人工智能发展规划的通知 [EB/OL].[2019-05-20].http://www.gov.cn/zhengce/content/2017-07/20/ content_5211996.html

[3]向飒.人工智能对学术出版流程的再造及知识服务提升[J].中国科技期刊研究,2018,29(11):1091-1096

[4]丁伟.新媒体内容生态演进的8个方向[J].新闻与写作,2018(11):78-79

[5]周群,化柏林.基于多源数据融合的科技決策需求主题识别研究[J].情报理论与实践,2019,43(3):107-113

[6]梁丽,谢凤杰,池丽旭,等.特定学科热点和前沿主题研究方法实证分析[J].图书馆杂志,2018,37(1):19-26,32

[7]王曰芬,曹嘉君,余厚强,等.人工智能研究前沿识别与分析:基于领域全局演化研究视角[J/OL].[2019-05-17].http://kns.cnki.net/kcms/detail/11.1762.G3.20190517.1135.002.html

[8]潘有能,贺焕振.基于合著与引用加权的专家知识地图构建研究[J].情报杂志,2018,37(8):128-132

[9]宋小康,何劲,王曰芬.大数据驱动下情报研究知识库构建的关键技术及实现[J].情报理论与实践,2019,42(1):34-40

[10]毕马威-阿里研究院:打造智能化组织[EB/OL].[2019-05-12].https://www.vzkoo.com/news/412.html

猜你喜欢
科技期刊大数据人工智能
科技期刊的分类
科技期刊的分类
科技期刊”
科技期刊的分类
2019:人工智能
人工智能与就业
数读人工智能
基于大数据背景下的智慧城市建设研究