基于XML结构化数据的期刊信息化建设路径探析
——以西南大学期刊社为例

2021-10-21 02:40崔玉洁周雨蕾
西南大学学报(自然科学版) 2021年10期
关键词:集约化结构化期刊

崔玉洁,文 娟,包 颖,周雨蕾

西南大学 期刊社,重庆 400715

随着科技的进步,按需出版、 在线发布不断促使传统期刊向数字出版、 数据出版转型,XML作为一种描述数据和数据结构的语言,也逐渐应用到期刊的出版流程中.在国外,基于XML的研究已有20多年,近年来国内基于此方面的研究也在逐渐增加,越来越多的学者开始关注XML结构化排版[1-2].如陈肖玉等[3]在基于XML的科技期刊排版技术探究中,根据实践摸索出一套基于XML的相对高效的跨媒体出版流程.刘冰等[4]提出我国科技期刊应尽快实现基于结构化排版的生产流程再造.谭雪静[5]指出我们需要利用XML技术来完善编排校一体化出版模式,文章重点介绍了一体化出版流程的优势,既能提高工作效率,又能实现全流程的数字化出版,同时还可以实现多渠道宣传.霍振响等[6]撰写的基于用户角度的科技期刊数字化出版战略中,提出了建设XML一体化出版流程和创办纯数字化期刊的策略.本文以西南大学期刊社信息化建设为研究对象,探索了适合高校期刊信息化建设的转型路径,以期为期刊社信息化建设提出可行性的建议.

1 XML与HTML

XML(Extensible Markup Language)是一种可扩展的标记语言,可扩展是相对于我们接触的HTML(超文本标记语言)而言的,网页编辑时可以使用的HTML标签都是预先规定好的,不能根据个人喜好随意更改或者添加规定之外的标签,而XML是一种可以自定义标签的标记语言; 另外HTML是人为设计的,即使不用浏览器查看HTML的内容,人们也能大概知道其要表达的意思.遗憾的是机器不能识别,尽管这个文档标记告诉浏览器如何显示该信息,但是标记并没有告诉浏览器信息是什么,为了能让机器识别,这就需要使用XML[7].并且如果需要在HTML中显示动态数据,那么当数据变化时将需要花费大量的时间来修改此HTML文档,而XML可以优化此不足,因为XML中数据是独立存在的,可以通过几行JavaScript代码,读取一个外部的XML文件,从而更新HTML中的数据内容.由此可见,XML的创建主要是用来克服HTML的局限性,就像HTML的作用是显示数据,XML的作用是便于不同应用、 不同平台之间的数据共享和传输,也可以说XML是为Web而设计的,其本身不会做任何事情,它仅仅是包装在XML标签中纯粹的信息,人们需要编写软件或者程序,才能传送、 接收和显示这个文档[8].

2 XML结构化排版

常用的XML排版、 转换工具有以下4种:XSL Formatter可视化工具、 SXparser-XML效验器、 XML Editor编辑器、 XSL Template Designer-XSL模板设计软件.XSL Formatter可视化工具是用来对XML和XSL进行排版的软件,在报纸、 期刊、 电子图书排版中应用广泛,另外该工具可以将XML内容通过多版面显示,在无PDF打印软件的环境下可以直接将排版文件转换成PDF文件保存,还可以在SVG中输出排版文件.SXparser-XML效验器是一种检验XML格式的工具,可以对XML文件中的SGML文件及DTD进行检验.XML Editor是一款专门用来编辑XML文档的编辑器,XML编辑器通过智能化的操作界面,使其比以往的编辑器更加有效,会强制使用者创建合法的XML结构,还可以自动对XML语法的代码标注对应的颜色.另外编辑器还提供预设和可配置方案,只需单击就可以生成相同源的PDF,Epub,HTML和其他格式文件,扩展性强,支持并增强XML编辑器的内置XML发布框架,甚至可以创建自己的框架.XSL Template Designer是一款XSL模板设计软件,该软件主要用来完成XML数据的输出布局,可以轻松地实现复杂格式和公式的布局.

目前国内期刊界常用的XML排版来自3家公司:中国知网、 北京仁和汇智信息技术有限公司(以下简称仁和)以及北京北大方正电子有限公司(以下简称北大方正),但是这3家公司的XML排版又各不相同.中国知网采用方正书版排版(因中国知网目前只有基于方正书版的排版,故一体化排版及其延伸功能不做比较说明); 仁和主要采用的是自主研发的XML一体化排版技术,技术优势有以下几点:①编辑只需将原稿发给对方,仁和在较短的时间内就会将该文章的XML文件返回[9-11]; ②仁和自主研发的参考文献校对软件可对文章中的参考文献进行自动检测修改,正确率高; ③XML一体化排版中包含制图,编辑在后期的修改过程中可以自行在平台上修改,也可以将修改稿拍照传给仁和由其辅助修改,该方式对那些无专门排版人员的单位适用性强; ④可实现作者微信实名关联,实现文章状态及时提醒,自动给编辑和作者发送文章排版的进度,以及文章网刊发布后的点击量和下载量等.北大方正主要采用的是升级版的飞翔软件,支持对word,Excel等文件的直接排版,将原稿上传到系统后平台会自动将其转化成XML,HTML等格式的文件.北大方正排版的优势是排版速度快,文章上传后即可获得转换后的XML文件,2种XML排版详细对比信息见表1.

表1 2种XML排版对比表

3 西南大学期刊社信息化建设整体实施方案

3.1 搭建集约化期刊管理系统

集约化期刊管理是现代期刊社提高效率与效益的方式之一.所谓集约化是指集合各个生产环节的人力、 物力、 财力、 管理等要素,进行统一资源配置.同时以节俭、 高效为价值取向,进而集中期刊社核心力量,保持其良好的竞争优势.任何一个单位要生存和发展,要高效地把内部活动有机地组织起来,就必须建立与自身工作相适应的管理系统[12].西南大学期刊社在信息化建设过程中,充分认识到延伸传播空间的必要性,敏锐地把握期刊信息化的发展方向,密切结合自身工作需要,以集约化的建设思路成功搭建了新一代的集约化期刊管理平台,将传统的期刊管理从静态转变为动态,从事后管理转变为全程管理,使得期刊信息化建设实现了全流程监督和各阶段逐层推进的顺利融合,为期刊社的信息化建设提供了良好保障.

西南大学期刊社的集约化期刊管理系统分为5个模块:定稿模块、 编辑模块、 付印管理模块、 发行模块以及财务管理模块(图1).期刊集约化管理系统是对期刊社采用的原始稿件资源和数字化加工过程的各类资源进行统一存储和管理的一种集约化平台,该系统不仅可以展示期刊出版的最终产品形式,还可以详细地记录稿件的处理状态,如排版文件、 封面设计、 校稿记录等.图2为定稿阶段定稿目录在该系统上的展示页面,定稿目录不仅展示了稿件的基本信息,还标注了稿件的状态,同时责任编辑还可以根据文章的情况动态调整栏目顺序.

图1 期刊集约化管理系统模块图

图2 期刊集约化管理系统界面图

依托期刊集约化管理系统,期刊社实现了出版资源的结构化、 数字化全生命周期的管理,将传统的办公模式与新型管理模式进行动态组合,各项工作进度都以无纸化办公形式存在,同时加强了纸刊的管理,详细地记录了纸刊的流向,使得管理人员能够更好地进行期刊全流程的管理.

3.2 搭建结构化数据网刊发布平台

以XML为基础的结构化网刊发布系统是一种变革,在真正意义上实现了全文检索.基于XML的结构化网刊发布系统,使得平台上文章的网络传播效果得到了极大的提升.平台上所有的数据以结构化的形式存放,真正意义上实现了元数据检索,这种检索除了可以检索标题、 作者、 单位、 关键词、 摘要外,还可以实现文章中任意章节、 段落、 图、 表等的自动定位.网刊发布平台相比常规网站实现了搜索引擎的SEO优化,极大地增加了网站搜索的显示度,使得网站的浏览量实现指数级增长.网刊发布系统还会向期刊社提供流量监控报告,此报告会显示出在一定周期内,文章新增的被引量、 科研机构访问量、 文章访问及搜索热词的监控报告等信息.网刊发布平台还有另外的两大优点是:① 过刊查询的目录中新增加了“施引文献”这一标识,该字段可以自动统计文章在全网的被引量及详细信息,施引文献信息在目录及文章详细信息页面都会有展示(图3); ② 文章的详细信息页面还增加了同类文章推荐字段,该字段会自动统计本刊所有发表过的同类型文章,并逐条显示,该功能极大地方便了作者,缩短了其在搜索同类型文章中所耗费的时间(图4).

图3 引用排行

图4 完全以XML为基础的结构化网站

3.3 HTML全文的XML结构化展示

西南大学期刊社的《西南大学学报(自然科学版)》 《西南大学学报(社会科学版)》 《西南师范大学学报(自然科学版)》 《教师教育学报》 4本刊物在期刊社官网和投稿系统首页开通了HTML全文在线阅读,此全文展示与传统的PDF文件相比具有多种优势:① 读者阅读体验得到提高,并且不需要安装额外的阅读软件; ② 内容比PDF文件丰富,在制作过程中可以通过添加二维码的方式实现内容的增强出版; ③ 网页中可以通过添加超链接的方式实现与其他资源的互通互联; ④ 网页中的图、 表可以单独呈现,提高了读者的阅读感受; ⑤ HTML文件中全文的参考文献都相互对应,可以随时查找参考文献与原文的联系,并可对其进行延伸阅读等.但是,如果网站不是基于结构化的网刊发布系统,HTML文件就只是网站上的一个链接,无法实现全文的结构化检索,另外,在提高点击率和引用概率上面所起的作用不明显,无法在其他网站上提高论文的显示度.基于此,西南大学期刊社自2020年11月起开始搭建结构化网刊发布平台,使得平台上的HTML以XML结构化的形式展示,不仅可以实现碎片化阅读,还可以实现全文的元数据检索,同时网站的访问量也达到了指数级提升.

3.4 融合XML结构化数据的AMiner学术推广

AMiner平台是由清华大学计算机系研发的,拥有我国完全的自主知识产权,该平台的最主要优势是:① 期刊推荐:平台根据期刊的领域内容,精准挖掘相关的作者,并将期刊推送内容以邮件的形式发给作者; ② 编委推荐:平台根据期刊指定的领域、 H指数范围、 区域、 语言,在全球范围内推荐适合的、 适量的编委名单; ③ 会议推荐:根据会议内容的关键词,精确找到与之相关或者交叉学科的参会者,并通过邮件的形式向其发送会议通知; ④ 辅助期刊选题策划:系统后台根据大数据的学科热点分析、 交叉分析、 前沿分析等,帮助期刊完成下一年的选题策划.目前,西南大学期刊社分管的4本学术刊物已经加入到AMiner平台中,并开始每期主推文章的精准投送(图5为西南大学期刊社《教师教育学报》2019年6期推荐文章的制作及推送展示),读者点击文章题目将跳转到网刊发布平台的HTML页面,这也将AMinert平台与XML网刊发布平台实现了融合,期望此融合路径会在未来对提升期刊影响力起到积极的作用.

图5 AMiner推荐文章的制作过程及展示

4 后期工作规划

为了更好地适应期刊移动端阅读的习惯以及数字出版和大数据发掘等的需求,同时满足期刊的按需出版、 优先出版、 在线发布和加入全文数据库实现文献关联等要求,期刊社需要不断地改变传统的出版方式,XML结构化排版就是一种很好的方式.XML结构化排版采用的是在线排版,该排版方式满足排版人员、 编辑、 作者、 校对人员等多角色的在线校对和修改功能,文章从录用并上传到系统后采用全流程的结构化排版,编辑直接在线修改稿件,以所见即所得的方式提高了修改的效率,编辑也可以采用传统的纸质稿件修改,由排版人员或者仁和工作人员辅助在线修改稿件.该一体化排版还支持作者在线修改稿件,流程中编辑和作者的修改痕迹都会保留,方便回溯.XML结构化排版是期刊满足现代信息化发展的必经之路.期刊社已开始打造集成化的网刊发布系统,系统布置完成后将首先在网站上展示全部文章的元数据信息,该发布平台也是XML结构化排版文件的展示窗口,后期加入XML一体化排版后,可以直接实现稿件信息在网站系统上的一键发布.

猜你喜欢
集约化结构化期刊
期刊更名启事
期刊简介
促进知识结构化的主题式复习初探
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
期刊问答
探究县供电企业财务集约化实践分析
番茄集约化育苗关键技术
城市土地集约化利用研究
论县域小型农田水利工程改造的集约化管理