科技期刊数字化服务生态建设初探

2023-11-16 20:50胡晓丹刘砚哲
出版参考 2023年10期
关键词:服务网科技期刊

胡晓丹 刘砚哲

摘 要:出版行业数字化转型升级是大势所趋。科技期刊数字化工作起步较早,但业内关注较多的是编印发环节数字化及内容排版、传播的数字化。这样仅仅构成一个闭合环甚至单方面发散而未回收的单向线,未形成立体化服务网。本文基于构建科技期刊数字化服务生态的目的,从建设知识网、用户网、服务网三个层层递进又互有交叉的网络等方面展开构想,以期为相关从业人员提供参考。

关键词:科技期刊 数字化转型升级 服务生态 知识网 用户网 服务网

2011—2020年,政府主管部门出台了系列数字出版相关文件,如《关于推动新闻出版业数字化转型升级的指导意见》[1]《关于深化新闻出版业数字化转型升级工作的通知》[2]等,出版业数字化转型升级工作迅速展开。

而期刊特别是科技期刊,在数字化方面起步极早,不少期刊进行了数据库化和互联网化。其中有数据库如知网、万方、维普等,但基本上是从纸质转为数字媒介等展现形式的转化,以及标题、作者、摘要、正文、参考文献等大块内容的数字化;又如编、印、发环节的数字化,包括北京玛格泰克科技发展有限公司的期刊稿件采编系统,北京北大方正电子有限公司的“方正学术出版云服务平台”等;再如群刊杂志社的数字化工作,包括《中国科学》杂志社的科技期刊全流程出版平台(SciEngine平台),中华医学会杂志社的远程稿件管理系统,方正电子的数据中台、亚马逊云服务等。但以上基本是出版流程的升级改造和将新技术应用于内容传播,是对期刊社业务的数字化服务,而非对期刊内容的数字化利用。知网开发了“知网节”技术,包括各种知识网络节点,但其节点是文献,粒度不够细,其展现形式也是文献网络。

由上可知,期刊领域数字化大多实现了出版环节的闭合环,或传播上发散却并不追求用户反馈的单向线。在社会化阅读已进入数字时代的背景下[3],科技期刊也有必要关注相关数字技术的发展,探讨其应用于出版领域的可能性,继续深化科技期刊领域的数字化转型升级。

一、科技期刊知识服务生态构建具有可行性

科技期刊的本源是促进科学研究交流的工具,在“研究成果”认定方面的权威性,逐渐形成各自的地位。随着信息传播速度越来越快,研究人群不断扩大,且研究成果层出不穷,科技期刊亦应该发挥自己坚持追随知识领域最新成果的特点,积极尝试、应用数字技术领域的新技术、新方法。作者个人观点,科技期刊的初心是传播知识,出版领域常说“内容为王”,科技期刊最核心最根本的,应该是做好知识内容的服务。

在知识服务方面,科技期刊有着独特的优势:科技期刊有着极为明确的用户定位,以及极易锚定的用户群体,同时也掌握最前沿的知识。科技期刊应该把握好、服务好自己的“生产者”——作者,才能以内部驱动,继续升级。在知识爆炸的年代,仅论细分专业领域,也有着上万研究者及数倍的成果产出,即使仅用文摘、摘要、关键词,来阅读判断依然极耗费精力。随着技术进步,大数据分析、推荐算法等已可用于服务用户。例如,在融媒体发展模式的思考中,有基于画像模型建设、用户标签建立的受众聚合和精准推送,也有基于关系技术、新媒体社交平台的关系出版模式。[4]虽然“大数据”的关键在于“大”,而推荐算法要统计用户的各种操作以从中分析习惯,但科技期刊却因为极为明确的用户对象和较为精准的内容领域,可以适当取巧。

二、科技期刊数字化服务生态圈层建设

为了更精确地服务作者及读者,更广泛、细致地进行本领域知识服务,更恰当应用相关数字技术,科技期刊应该从以前的环状数字化,转化为网状数字化;应该把编、印、发数字化,深化至服务数字化。科技期刊可以搭建一个数字化的服务生态体系,该体系由三层网组成——知识网、用户网、服务网,层层递进而互有交叉。同时,所有技术应用的前提,是基于期刊本身所在领域的知识,是“期刊/知识+互联网/数字”,而不是“互联网/数字+期刊/知识”。因此,知识网,是作者构想的科技期刊知识服务生态的核心;知识网、用户网、服务网,是以知识网为基础的层层递进又互有交叉的网络。有了基于内容的知识网,才能形成有内驱力、可自行扩展运行的整体科技期刊数字化服務网络;同时用户网的扩展,也会反哺使得知识网不断扩展。目前基于大数据技术分析阅读喜好,情景感知计算,分析消费者的环境、行为和偏好等的用户画像、个性化阅读等服务,如能从本领域的知识本体体系出发,将更有益于深度发展。

1.知识网——知识服务的地基

(1)什么是“知识网”。要向读者推送知识,首先要把“这段知识到底是什么知识”标注清楚,其次要把“跟这个知识相关的是什么知识”整理清楚。这就是知识网。从某个知识为节点看起,各个知识点之间是网状的;从整体来看,其连接关系远超三维,现实中即使有,也会像线团一样错综复杂。只有借助数字技术,才能在数字空间中形成互相连接、相互激发的体系。

以上的“知识”是广泛意义上的“知识”,可以再从各个维度进行细化,大体区分不同领域,如数学、物理、化学、生物、化工、医药等,又如理论、应用、仪器、方法等。每扩大一个范畴,复杂程度都会按照几何甚至指数级增长。但反之,所涵盖的领域足够专,其复杂程度也会相应下降。这也是科技期刊需要先建立各自领域内知识体系的原因所在,越细分领域的科技期刊越有可能巧妙应用。

(2)如何搭建“知识网”。知识网搭建的基本做法是先进行颗粒化,将领域内文献打碎到可接受的最小单元,即知识元。在不同领域,其结果可能有所不同。比如在数学领域,单独“法则”有可能成为最小单元,但在物理、化学领域必须是某种具体法则。打碎之后再进行分类,例如前文提到的“理论、应用、仪器、方法”,或者本领域通行分类。但分类只是为了前期整理和后期展示方便,真正的知识网成型之后已经超越了“分类”。分类之后再根据知识元之间关系,将其编织成网。分类有利于加速编织,一门大分类技术下的小类,其知识网关系大部分可以复制,少部分则是该小类的特质。编织手段无非人工智能及真正人工,只是比例多少的区别;在人工智能大发展的现在,人工分类被大幅度压缩,但仍不可或缺。在科技期刊领域,资料虽多却条理性极强,使用人工智能使其效率大大加强,而人工纠偏的准确率更高、工作量更小,这又是科技期刊可以取巧的点。

知识网的实现基于XML技术。方正电子的学术出版平台,应用的就是国际公认的JATS XML数据标准[5],中国医学会杂志社亦曾制定发布过自己的XML標准。[6]但据统计,2019年,仅有17家百强中文期刊网站推出了HTML全文阅读。[7]近年来,我国期刊数字化进程加快,这个数据应有所提高。不过目前XML技术还停留在结构化排版、一体化平台等应用,相应XML标准中的元素主要与排版相关,如文题、作者、刊名、卷期等,而非与文章本身的知识属性相关。本文所说的知识网,即在搭建期刊所属领域知识本体的基础上,将本体关键词作为XML元素进行标注,才可以搭建成形。但实际应用中,应视技术成熟度选择不同的颗粒度。

(3)如何应用“知识网”。搭建成功的知识网,存在于数字空间。人工无法看到其整体,只能“窥一斑而知全豹”。这个“斑”就是某个具体的知识元,我们可以看到它所关联的其他知识元,而顺着关联看过去,又是一张新的网状结构。例如,化工领域,查看“精馏”,可看到其相关的原理、计算、设备、仪器;看某设备如精馏塔,又能看到各种塔器,如筛板塔、填料塔;看填料塔,会看到各种填料,或该塔的应用场景;看应用场景,又能发现其他化工单元操作。化学工业出版社在前期的文产项目中,曾经建设过“化工领域专业知识体系”,可备参考。再例如合成生物学领域,知识元“基因”可能关联到各种基因操作技术,某技术可能关联到具体成果或疾病防治,某疾病又关联到脏器、营养成分等等。

知识网实际的应用,与前面说的“看”类似,只是不用人眼,而是用程序、用平台、用“机器”去看。这里先说科技期刊领域内的应用——首先由“机器”标注,本期主题对应什么知识元、包含什么知识元,本栏目对应、包含什么,本篇对应、包含什么,本章本段本句……只要是用户可能用到的层次,都要标注。其次统计,实际中是用户阅读了本刊、本文献,“机器”中是用户看了哪些知识元,怎么看的(一掠而过,还是慢慢看,还是看过之后又掉过头再看),然后进行分析。根据所统计的知识元使用数据,辅以本期刊领域的专业知识体系的分类,为用户画像,展开针对性的推荐。

2.用户网——知识服务的初级目的和下级开端

需要注意的是,上节末尾“首先……其次……然后……”并没有跟着“最后”。原因很明显,在统计步骤时已出现“用户”,更不用说分析步骤。知识网确实是基础,用户网是在知识网之上搭建的,但不可避免地出现交叉。

(1)什么是“用户网”。以往数据库化的期刊服务产品,都对“用户”特别是“作者”有字段标注,研究领域、个人简介、已发表文章等。但这些标注往往是“死数据”,这样不足以被称为“用户网”。

那么,什么是“用户网”?这要先说什么是“用户”。笔者认为,科技期刊的用户可分为以下几类:首先是作者,其次是潜在作者即学生,再次是政府人员,最后是广告商。此分类是按照对行业、专业领域的发展贡献来说的,作者和学生是研究者、产出者、直接推动者,是自然人;政府人员(或者扩展相关领域内不做研究但做决策的人)是辅助者、间接推动者、约束者,这类里可能是自然人也可能是法人。

明确了“用户”,就可以明确什么是“用户网”。就像“知识元”编织成“知识网”一样,把“用户”当成一种知识,将其相关联的研究领域、成果、单位也包括“用户”本身当成知识元,所编织成的“知识”网,就是“用户网”。

(2)如何搭建“用户网”。一本科技期刊最初级的用户网,就是其所有文章的通讯作者所构成的网,这样的网可以人工搭建,但其更像一个表格、一个简单的数据库,还没有复杂成网状。再进一步将第一作者、其他作者容纳进来,到这一步,努努力,或者加上“完善资料有奖”这样的互联网营销手段,也有可能通过人工达成。

再进一步,将所有参考文献涉及的作者都容纳进来,就不是人工所能做到。此时必须应用爬虫技术,将所有文献、所有作者信息搜集到,再将其单位信息网入其中,在“知识网”基础上,进行语义拆分、语义分析,把该文献全文或者摘要走一遍“知识网”流程,在丰富“知识网”的同时,将“用户”的“研究领域”等“知识”相关属性补充完整。

(3)如何应用“用户网”。用户网最基础的应用就是向“用户”推送信息——推送其研究方向相关的信息,推送其感兴趣/历史阅读最多的信息,推送其研究领域内的“用户”的最新文章,推送其单位其他“用户”的研究动向……当然,以上信息要全经过“知识网”的分析、整理。或者像任何社交平台一样,关注“用户”,或者基于用户网本身进行推荐:你的老师、你的学生、你所在领域的研究者都在做什么。

以上是从“用户”的字段属性出发,也可以从“知识”出发:最近有了一项成果,哪些“用户”可能对此感兴趣,第一时间推送给他,不必等他去主动阅读、检索——不必非做“期”刊。

期刊内部也可以应用用户网,最直接的就是外审专家,相关领域内、排除同单位、同门信息,系统自动匹配,而不需要编辑人工搜索。

3.服务网——整个服务生态连接的桥梁及不断拓展的推动力

(1)什么是“服务网”。有了基于知识网标注好的文献资源,就相当于有了产品;有了用户网络,就相当于有了渠道——服务网自然而然就出现了。前文中所述及的应用,就是最直接、最基础的服务网。为行文方便,此处进行定义:服务网,就是基于知识网及知识网支撑的知识库,通过用户网,所产生的除了“直接的知识增值”之外的一切有益于“知识增值”的活动及其组合。

(2)如何搭建“服务网”。正如前文提到的,知识网、用户网、服务网是层层递进但又互有交叉的网络,知识网、用户网搭建成形之后,服务网随之自动出现。但这并不代表服务网的搭建是完全自动的,从本质上说,服务是用户需求的体现,而有些需求迫切、有些需求潜在,甚至有些需求需要人们去发掘。

又如前文提到,科技期刊的本源是为了促进知识交流,如何更好地达到这一目的,就是期刊编辑甚至科研人士所要努力的方向。这个过程会发现、产生各种的服务,交织、融合形成更大、更完善的服务网。这样的网络不是作者可以独自一探究竟的,下文将提供一些思考,以抛砖引玉。

(3)如何应用“服务网”。除了前文提到的直接基于用户、知识的服务,之前也曾提及广告商。广告商是科技期刊的特殊用户,其产品可以作为一类特殊知识,也许是仪器、设备,也许是算法、技术。这些可以作为“广告商”用户的属性字段,在作为知识存在时也可以加注“广告”标签。基于以上标注,采集数据并分析,便可以向研究者推送同类更先进、更质优价廉的仪器,也可以向厂家提供广告观看、购买转化数据。

又或者基于知识网集成相关文献,甚至在人工智能发展的情况下[8],直接生成某专题内综述,帮助研究者建立该专题基本认识,掌握最新动态。再如基于知识网分析,某个新技术可能对某些领域产生推动作用,则直接推送给领域内研究者应用——甚至在他们之间以技术中介身份出现。对于政府部门,某个领域发展如何,是否需要推动、支持?政府部门如果支持,相关领域研究者又是否能够第一时间得知?诸如此类。

三、科技期刊数字化服务生态构建总结及应用展望

出版业数字化转型升级中,期刊特别是科技期刊曾经领先出发,取得了优异的成果。科技期刊拥有最先进、最准确的知识来源,又拥有极明确、极精准的用户团体,只要合理运用人工智能、大数据、语义分析等先进工具,必能继续引领出版领域的数字化转型升级。而要做到这一点,需依次认真研究并搭建各自领域内的知识网、用户网、服务网,并不断更新迭代;用户网、服务网作为特殊的“知识”网,其扩展会反哺知识网的扩大及完善,形成该领域内的小型知识服务生态。各领域网络建设成熟时,再相互打通形成更广泛的知识网、用户网、服务网,构成更大的知识服务生态。要做到这样,并非一时一日之功,也不止一人一刊之力,但如能建成,则令真正形成科技期刊数字化服务的生态。

(作者单位系化学工业出版社)

猜你喜欢
服务网科技期刊
科技期刊的分类
中国听障儿童服务网开通助听器免费借用服务
科技期刊的分类
嘉陵区:用心编织服务网 真情保障担使命
科技期刊”
科技期刊的分类
科技期刊的分类
社区治理如何密织服务网——成都安公社区划了“五条线”
四川政务服务网上线
科技期刊数字出版的实践与展望