秦雅萌?商建辉
【摘要】利用XML技术升级编辑出版手段,是科技期刊增强出版内容附加值,构建数字出版生态的重要支撑。文章以2020年度中国科技期刊卓越行动计划高起点新刊为研究对象,重点对其XML出版实践进行描述性分析。研究结果表明,样本刊物通过构建一站式智能化的XML编辑出版平台,利用XML技术打造细粒度、高增值的刊文内容,充分对接主流权威数据库,有效满足了用户异质需求,為增强我国科技期刊数字出版传播力、声誉力与影响力带来重要的借鉴启示。
【关 键 词】科技期刊;XML;编辑出版
【作者单位】秦雅萌,河北大学新闻传播学院;商建辉,河北大学新闻传播学院。
【中图分类号】G230.7 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2021.05.018
随着智能信息技术在数字出版行业中的广泛普及,我国科技期刊的数字出版质量得到跨越式提升。一方面,科技期刊利用可促进在线约稿、投稿、组稿等出版流程节点有效衔接的数字出版技术,为一体化数字出版奠定硬件基础。另一方面,科技期刊高度关注数字出版内容可读性,持续增强刊文的颗粒度与感染力。但读者对科技期刊出版内容、出版方式与出版渠道的要求日益增长,传统的数字出版手段很难保证科技期刊内容传播的实效性与针对性。XML技术作为当今处理分布式结构信息的有效工具,将其应用于科技期刊数字出版领域,有助于同步实现数据规整性处理与多渠道分发,推动数字学术资源的泛在共享[1]。鉴于此,目前全球高水平科技期刊均开始全面推行基于XML技术的数字出版:如Nature、Science、Cell已经拥有十分成熟的XML出版管理系统,这些系统可对科技文献进行包括采编、处理与发布在内的全链条管理,并利用XML技术为读者提供数据关联分析与文本深度挖掘等增值服务。我国科技期刊的XML出版亦取得长足发展:入选中国科技期刊卓越行动计划的刊物不仅开通了基于XML的智能编辑业务,而且为用户提供视听资源、文献链接与知识关联等增值服务,此举极大拓展了科技期刊数字出版的功能边界。文章分析了2020年度中国科技期刊卓越行动计划高起点新刊XML出版的实践经验,提出有助于我国高水平科技期刊XML出版可持续发展的策略启示。
一、研究对象与数据来源
中国科技期刊卓越行动计划由国家新闻出版署会同中国科协等部门合作发起,目标是创建我国科技期刊可持续发展支持体系,是目前我国实施力度最大、投入资金最多、覆盖范围最广的科技期刊支持项目。其中,高起点新刊项目希望通过支持创办一批聚焦新兴交叉学科的国际英文新刊,增强我国科技期刊的国际学术影响力与全球创新策源力[2]。2020年7月11日, 中国科技期刊卓越行动计划办公室正式发布2020年度中国科技期刊卓越行动计划高起点新刊项目入选刊物名单,从项目规划可行性、基础办刊条件、国际化办刊条件三个方面遴选了30本刊物作为资助对象[3]。中国科学评价研究中心发布的《中国学术期刊评价研究报告》(第六版)指出,2020年度中国科技期刊卓越行动计划高起点新刊充分发挥XML出版技术的价值红利,构建了集采编、结构化校排与网络发布等功能于一体的数字出版运营体系[4]。
本文以2020年度中国科技期刊卓越行动计划高起点新刊为研究对象,采用网络调研与文献调研方法针对样本期刊XML出版技术、内容、流程进行实证分析。首先,文章通过网络调研手段深入考察样本刊物XML出版的工作流程与核心功能,对此类数据进行分类处理。其次,采用文献调研方法进一步萃取样本期刊XML出版的隐性数据,为后文的策略分析提供参考依据。
二、样本期刊XML出版的实践策略分析
1.创建全流程一体化的XML编辑出版平台
第一,依托成熟的XML一体化内容生产管理云平台同步推进编校工作。如《中国机械工程学报:增材制造前沿》利用中国知网研发的腾云全流程数字出版平台增强内容运营管理绩效。一方面,借助该平台的数据资源智能管理、信息可视化加工、多主体协作编辑等功能单元,对刊文内容进行高精度归类分析,并实现基于内容结构与内容属性的数据标准化存储,形成各类XML文档结构化定义出版素材库。另一方面,凭借XML自动化加工与主题标引功能,促进数字出版内容与形式的有机统一。如开展基于XML的文献元数据提取工作,协同推进数字出版内容的XML文档转换与规整化处理。
第二,构建面向出版流程优化的智能编辑系统。如《废弃物处置与可持续能源》高度重视XML出版内容的一站式运营,依托XML技术开发了内容定制化加工服务系统,开展数字内容全生命周期管理。一是通过网络资源采集、电子文件转换、元数据标引等智能校排工具对刊文内容进行自动化加工标引,生成体现知识内在语义关系的XML格式文档。二是基于XML格式内容,实现自动标准校对,包括知识体系管理、结构化标引、智能分类标引、标引对象管理等。三是打造模块化的文档编辑引擎,采用“流文件”形式发布传统的版式资源,支持多终端、多形态的数字阅读方式。
2.依托XML技术为用户精准推送高增值内容
第一,利用XML技术对数据层、信息层与知识层中的数据进行语义关联组织,以形象化揭示刊文内容的相关信息。如《数学与统计通讯》利用页面知识语义关联方式拓展XML出版内容边界,让用户通过“智能推荐”“自动关联”“订阅推送”“行为日志”等功能模块,获取更多与XML出版内容高度相关的基础数据信息。《能源材料前沿》凭借XML技术高效挖掘刊文内容的知识元数据,据此组建出版机构知识库,不仅允许读者开源检索数据库中的高价值信息,而且极大地促进了各类型科学数据的关联推荐。
第二,利用XML嵌入式技术让用户及时了解刊文内容的学术影响力。《国家科学进展》的做法较具代表性。其不仅在XML页面中添加了“关联发现”“统计分析”“采访决策支持”等用户行为分析与期刊传播力分析的功能单元,为用户智能推送期刊影响因子、收录分区情况、开放特征、机构成果等大数据分析报告,而且让用户下载无版权争议的数字资源。为增强XML出版的穿透力,《国家科学进展》在微信公众号开辟“问答式社交服务”专栏,利用XML自然语言处理技术,让用户自定义数据检索条件,公众号后台会结合用户过往的检索行为向其定制化推送增值信息。
第三,对学术论文中的实证结果、推演流程进行视听化表达。一是基于XML技术丰富视听文本。《CAAI人工智能汇刊》利用XML数据流查询处理技术对刊物官方网站中的视频资源进行全媒体发布,在对其进行增值化深加工基础上,实现期刊不同传播介质的资源共享。二是策划模块化、层次化的视听内容。《生物安全和生物安保杂志》借助XML分面搜索推荐技术提供分层分类的视听数据推送服务。如为生物学科专业研究人员推送研究热点与研究前沿的主题短视频,为普通学生与其他社会受众推送常识性科普视听文章,显著增强视听内容的权威性与贴近性。
3.通过共享权威数据库增强XML出版生产力
第一,与主流数据库建立共享关系,提升XML出版内容的供给能力。一方面,深度对接业内权威的数据仓储平台,实现与国际主流学术出版平台的数据实时交换。当前,样本期刊均与爱思唯尔Ei工程索引数据库、Springer电子期刊数据库、IEEE/IET Electronic Library等数据库服务商缔结了深度合作关系,确保读者能够实时获取最新、最权威的科学数据。如《生态过程》基于XML技术建立了面向读者免费服务的合作模式:与尚唯科技报告资源服务系统签订了合作完成XML全文的框架协议,读者将鼠标悬停在对象引用标识符上便可自动获取与之适配的外延链接数据。另一方面,依托权威数据库扩大XML出版的覆盖面。如《植物表型组学》在获得SAGE Journal平台的XML出版权后,IOS Press Journals期刊数据库立刻对其近十年的刊文进行XML网页发布,科睿唯安仅用7天便完成了对XML文章的元数据提取工作。
第二,吸纳优质用户成为XML出版策划主体。一是依据投稿与在线评论质量对用户进行评级,凡被认定为优质用户的读者,将会定期获得科技期刊主动推送的同一研究领域内的前沿文献、刊文数据被引情况等个性化信息。如《新兴污染物》创建了包含积分管理、群组管理、订阅管理等功能的用户社区服务生态圈,让活跃在评论区的优质用户成为XML出版的主要顾问。二是为增强XML出版的时效性,样本期刊均提供基于XML的预印本服务,采用XML超链接手段第一时间刊发综述论文,显著激发读者参与XML出版的内生动力。
三、我国科技期刊XML出版的发展路径
1.打造基于XML技术的智能化编辑出版系统
第一,构建基于XML的数字化加工标引系统。一方面,从互联网上系统化采集公开出版的数字学术资源,经过智能数据处理、存储、发布,并结合讀者个性化需求进行聚类存档,形成兼具专业性与权威性的学术资源池。如利用基于XML的WEB数据挖掘技术对国内外网络学术站点最新发布的数据进行针对性抓取,在对采集的信息进行过滤、信息去噪和结构化内容提取的基础上,对其进行自动聚类与关联整合,从而发现热点学术情报。另一方面,构建元数据标引模块。即发挥XML技术的知识结构化标引、内容碎片化标引等特色优势,对刊文内容进行基于元数据的多维度标引,据此为读者推送具有差异化知识元本体的超文本。如对多来源、多语种的网络数据资源进行知识框架自动分析与文本知识元分析,而后从主体部分(存储论文正文关键信息的元数据)、后置部分(存储术语表等辅助信息)、浮动部分(存储文章的同行评议意见与次级论文等元数据)三个方面规划不同应用场景下的知识库标签集,为XML出版奠定数据支撑。
第二,促进XML出版服务模块间的深度交互。一是构建协同编撰平台,对XML出版呈现形式与内容进行动态组合。如利用基于XML的工作流程管理、编辑工具集成等功能插件,让科技期刊编校人员和读者协同开展刊文内容的XML转换、XML注释等校排工作,提高XML出版的集成化管理水平。二是创建全媒体资源管理平台,促进期刊学术资源检索浏览、资源库管理与资源云服务的无缝对接。如借助基于XML的自然语言检索引擎对非结构化数据、NXD数据、关系型数据进行跨媒体数据挖掘分析,构建涵盖元数据文件、多阶索引文件与数字对象文件的全媒体分布式资源系统,实现科技期刊全媒体资源基础管理、收集管理和迁入迁出管理的有机协同。另外,科技期刊还应加快建立XML出版数据标准,基于统一的文档格式打通XML出版数据资源流动的阻滞点,促进XML出版内容的高质量共享。
2.利用XML技术提供定制化、个性化出版服务
第一,借助XML技术丰富科技期刊数字出版内容。一是做细XML出版知识导航服务。即借助基于XML主题地图的知识导航技术的细粒度呈现刊文内容。如利用XML自动版面分析技术精细化拆分数字出版导航目录,通过思维导图向读者呈现XML出版内容中基础信息的关联关系。二是做精社交化知识问答服务。社交化知识问答服务是科技期刊用户增值服务的重要构成,以简洁明确的XML标记语言回答用户咨询,形成个性化的知识服务社交网络,有助于提升用户的依赖感和忠诚度。如利用XML Servlet技术构建全场景知识问答系统,通过问题深度分析、答案生成与排序对用户意图进行命名实体识别,确保科技期刊快速锁定用户目标信息。三是做强专题知识库运营服务。专题知识库运营服务是根据学科与主题将文本知识元进行关联整合,进而为用户提供专业性知识集成产品的服务。科技期刊应利用XML文本热点分析技术与文本聚焦技术创建可满足读者差异化资源需求的专题知识库,以提升用户对XML出版服务的价值感知[5]。
第二,提供XML出版资源情境化推荐服务。科技期刊XML出版是情境化、多维度、立体化的知识传播行为,其实践主旨是在用户与期刊之间形成常态化情境适配的交互关系,进而实现信息资源的靶向投放。因此,借助XML资源推荐技术为用户提供与其使用情境、需求画像相契合的目标数据,能够大大增强用户的感知体验。如《中华放射医学与防护》创建具有广视域、全覆盖特征的资源推荐系统,借助XML嵌入式技术将移动图书馆、数字图书馆等数字学术平台嵌入科技期刊网站,通过构建用户标签体系提高XML出版资源推荐的情境化、定制化水平。
3.常态化对接优质用户与权威学术数据库
第一,放开学术数据库的访问接口,通过数据库跨媒介动态链接组建开放式学术资源门户。一是开发支持科学数据跨库链接的功能接口,确保科技期刊能够无障碍共享主流数据库中的优质资源。如创建以数据交换接口、元数据管理接口、API集成接口为核心的学术数据库访问接口体系,与数据库服务商签订旨在实现科学数据开放存取的接口协议,在科技期刊与数据库间营造科学数据共建共享的生动态势。二是为规避跨库检索过程中的版权侵权风险,科技期刊应与数据库缔结XML出版资源安全共享协议,在获取数据库服务商资源链接权限许可的前提下,使用户能够合法合规地跨库调用XML出版资源[6]。
第二,提供人性化的数据共享服务。一方面,科技期刊可建立用户知识贡献激励机制,引导用户深度参与XML出版全周期。如坚守以用户生成内容为核心的读者培育理念,基于用户网络评论的转发量与采纳量等数据对读者进行分级管理,并依托XML DOM节点树技术量化分析用户声誉的波动情况,为拥有高声誉等级的读者匹配更大的数据共享权限。另一方面,科技期刊可应用“内容+平台+数据”的运营模式,促进用户、XML出版渠道和论文作者深度融合。如利用基于XML的知識表示技术全方位呈现学术论文的创新点,系统整合用户学术成果中的信息流与知识流,推动科技期刊从知识传递者向学术贡献者转变;通过XML文件可视化方式对刊文内容中的知识元、知识条目等进行体系化关联,进而形成“用户贡献—知识挖掘—共享增值—用户成长”的良性循环。
|参考文献|
[1]周小玲,侯春梅,黄爱华,等. 我国百强中文科技期刊XML/HTML出版现状调研与分析[J]. 中国科技期刊研究,2019 (1):40-45.
[2] 高雅丽. 七部门联合实施中国科技期刊卓越行动计划[N]. 中国科学报,2019-09-23.
[3]关于对2020年度中国科技期刊卓越行动计划高起点新刊项目拟入选项目进行公示的通知[EB/OL]. (2020-07-
09)[2021-01-16]. http://news. sciencenet. cn/htmlnews/2020/
7/442636. shtm.
[4]RCCSE《中国学术期刊评价研究报告》(第六版)新鲜出炉[EB/OL]. (2020-10-26)[2021-01-20]. http://www. eshukan. com/displaynews. aspx?nid=888.
[5]赵少飞,陈辉. 基于XML一体化生产管理云平台的科技期刊出版流程优化实践[J]. 编辑学报,2018 (6):627-631.
[6]周骥. 学术期刊的移动出版:现状、问题和策略[J]. 传媒,2020(1):31-34.