开创科技知识服务新平台
——打造透明全新的科技生态圈

2018-11-07 08:25赵艳春
传播与版权 2018年9期
关键词:生态圈图谱科技

赵艳春 王 哲 余 丁

随着互联网的飞速发展,大数据时代的到来,包括各种电子书,VR(虚拟现实)技术在书中的应用,不仅改变了人们阅读方式,而且也不断影响着人们的生活模式。出版社作为知识传播的主要承担者,也要随之改变,不断地适应作者、读者,改变服务作者读者的方式,更好地发挥“传播知识 创造未来”的作用。我们传播什么样的知识,就有什么样的科研环境,就会呈现什么样的学术氛围。如果我们传播的都是高水平的、业内公认的科研成果,就会呈现清新正气的学术氛围,反之如果我们传播的知识参差不齐,读者获取的信息也会良莠不齐,那么以此为基础再次产生新的成果的时候,就会鱼龙混杂。

就出版界而言,近几年我国每年出版新书都在26万种以上,却存在着“大而不强”的问题。清华大学教授施一公曾多次表示,我国已经在2020年之前论文数量已经超过美国,但是他很担心,垃圾太多。这不仅折射出科研评价体系的问题,也反映出学术传播本身有很多亟待改进的地方。全国政协委员、商务印书馆总经理于殿利直陈行业发展痛点:“我们这个行业,面临着‘有高原无高峰’的现象和‘好书不少垃圾更多’的现状。”[1]可见全面提升出版质量,迫在眉睫。

2017年底我国提出了从出版大国向出版强国的转变,不仅要提高出版质量,同时会缩小出版规模,而如何打造精品,让更多原创的科学成果在祖国大地开花结果,也是对科研成果的传播者提出了更高的挑战。由于科技出版有其自身的特殊性,他是小众化的出版,他是科学家成果的结晶,他的读者也是科学家们自身,因此作者和读者高度结合,整个产业形成了闭环[2]。这要求我们不仅从选题策划开始优选创新成果,且在成品之后,更能反馈给读者一个高质量服务。也就是我们提供给科研工作者全生命周期的服务,让科研工作走进一个良性的循环过程中。

结合国内外形势,我国自身特色,如何形成我们自己的知识服务体系,为科学研究服务?面对如此复杂多变的世界,科技出版结合自身的特色,不仅要传承传统出版传播知识的重担,而且要肩负从专业、生活、科普等多个维度,从文字、音频、视频等多个形态,从知识的传播者、平台的搭建者到最终全新透明科技生态圈的建立为目标。简而言之,知识服务的定义是从大量的隐形和显性资料中,根据人们的需求将知识提炼出来,并有针对用户的需求解决问题。流程可以概括为:知识内容的聚集—(根据用户的需求)知识的加工提炼—知识的提供。可见知识内容的聚集是源头,知识的加工提炼的是手段。由此可知,内容是核心,服务是根本。这要求我们在内容的呈现上力求精品,做到权威性,科学性;在知识的服务上力求多层次,多样化,同时做到系统性,深入性。只有这样我们才能超越传统纸媒的单一化服务,超越现在互联网所能提供的简单大量信息的服务。

尽管出版社积累了大量的信息和资源,但是如何让这些资源为潜在用户使用和消费值得进一步研究。图书出版社有大量的图书信息,每本书都是一个完整的系统,当我们把书的内容打乱重新组织的时候,相关的知识就会呈现出来,如何呈现出用户需要的,呈现出知识树的情况,这就是现在被广泛提及的知识图谱。知识图谱的概念最早由谷歌在2012年提出,旨在描述真实世界中存在的各种实体或概念,如人物、商品、景点、电影等。国内各大学术出版机构利用本体、关联数据、知识图谱等语义技术构建更加新颖的科学知识图谱[3]。科学知识图谱是科学领域智慧数据的表现形式,更是新型知识服务的数据基础,在2017年受到了斯普林格、微软等知名出版集团和互联网公司的重视[4]。斯普林格·自然集团的科学知识图谱SciGraph[5],关联集成了科学论文内容信息、作者信息、题录信息、会议信息等,能够满足科研工作者对科学知识语义检索、查询结果可视化等需求。MAG由微软公司研发,关联集成了包括科学论文、作者、机构、会议及相关领域的数据,向科研用户提供精确的文献检索服务[6]。清华大学的Aminer利用数据挖掘、自然语言处理、社会网络分析与挖掘等技术,构建科学知识图谱,向科研用户提供语义信息抽取、话题发现和趋势分析等在内的众多功能[7]。构建面向科学领域知识图谱要全面整合多源、异构的领域知识与出版物内容,实现知识图谱的丰富与扩展,构建科学交流的完善体系。

而到底呈现什么样的知识图谱才是客户所需要的呢?结合科学社自身的特点,选题立项是科学研究的第一步,也是至关重要的一步,既决定着研究者现在和将来的主攻方向、目标和内容,也在一定程度上规定了科研活动采用的方法和途径。围绕选题我们为客户提供该方向的相关理论探究与应用研究。这其中哪些是前人未曾研究过,而哪些又是前人已经研究过的(在这其中哪些是研究但是未解决的问题,哪些是已经解决的问题)。根据每位研究者的科研状况,从而给出可能的研究对象,研究范围,研究内容乃至研究方法。对现有资源进行大数据分析,可以为科研工作者提供如图1所示的知识服务。

图1:通过大数据分析提供的科研方向的知识服务

我们还可以从另一个维度进行细化的数据分析研究,深入研究我们所拥有的知识数据,针对不同的客户,开展多种维度的研究,从中挖掘出新的养分。一本学术成果专著从内容结构上看,应该至少包含三部分:创新的学术价值,成熟知识体系的运用,对未来这一学科领域发展的预测。首先,创新性学术成果主要指思想,理论,观点,方法,过程上有创新,也就是说通过科研工作者的加工,在原有的基础上,产生新思想,新理论,新观点,新方法,新研究的过程[3]。其次,随着科学技术的不断发展,社会分工越来越明确,知识领域专业划分越来越细致,互联网对各行各业的影响不断深化,新的问题总是层出不穷,人类创新的脚步不断迈进。习近平总书记在2016年全国科技创新大会、两院院士和中国科学技术协会第九次全国代表大会上,提出广大科技工作者要把论文写在祖国的大地上指示,也就是不断推进“知识创新,理论创新,方法创新”。最后,按照总书记的指示,我们进一步梳理专家们的科研成果,把每本书中的创新从三个维度提炼出来。把每本书中涉及这一创新的相关知识体系提炼出来,把每本书创新的相关领域的发展预测提炼出来,最终凝练出供作者需求的全面的小领域展现。如图2所示。当然这一过程其实需要大量的专业的科学家的人工判断,并非简单的数据分析可以做到,是通过对所有知识源的标引,充分将某一学科的知识全面联系起来,建立领域知识本体,为新一轮的科技创新奠定基础。呈现给用户的好似一棵枝繁叶茂的大树,科研工作者看到这棵树,仿佛看到自己站在哪里,下一步应该往哪里走树才能长得更加繁茂。

当能够给用户,科研工作者提供这样的知识服务的时候,我们也就实现了全新透明的科技生态圈的打造。在这个封闭的科技生态圈中,我们引入了开放的概念,不仅完成了所有人对科研成果的展现,也实现了对已有科研成果的检验,在互联网中实现全程可见,均可查询,实现了知识的互联互通,共享共用。

图2:为寻找创新的方向提供服务

知识图谱的构建,知识服务的提供需要高水平的内容质量,配套的新技术,大量开放数据的获取,大量的学科专家参与,需要极大的投入和长期的过程,若构建成功,我们也就打造了全新透明的科技生态圈,良性循环已经形成。

知识服务系统的建立不是一日之功,是对现在体系庞大资源的深度挖掘、发现和组织。这不仅需要出版业横向纵向发掘各类资源,联合各行业,形成强大智力支撑的内容和资源,而且需要大量新技术的介入包括大数据,人工智能,VR技术等,最终实现大到各行业都有自身的知识图谱,帮助行业和产业升级改造,小到为每个用户提供知识图谱,帮助个人实现职业梦想与规划。只有这样才能让已经拥有的大量的信息、可靠的数字资源发挥更大的作用,才能日益增强出版界文化自信,实现文化强国的重要目标。

猜你喜欢
生态圈图谱科技
绘一张成长图谱
科技助我来看云
新区制造生态圈
科技在线
补肾强身片UPLC指纹图谱
科技在线
主动对接你思维的知识图谱
科技在线
跑步生态圈
崭新的“医疗生态圈”