智能化编辑加工系统的应用——以《国际检验医学杂志》为例

2018-12-25 05:55曾蕴林
学报编辑论丛 2018年0期
关键词:宏程序代码稿件

周 丽,曾蕴林,苏 畅



智能化编辑加工系统的应用——以《国际检验医学杂志》为例

周 丽,曾蕴林,苏 畅

(重庆市卫生信息中心,重庆 401120)

随着网络及互联网技术的发展和普及,越来越多的期刊和编辑部开始使用稿件采编系统,传统的稿件采集形式已成为制约期刊发展的关键问题,办公自动化、网络化的实践应用被期刊社或编辑部所认可和接受。借助计算机VB(Visual Basic)代码和宏程序,实现期刊收稿、组稿、审稿、编辑加工到发排全过程的计算机系统软件智能化,可提高编辑的工作效率,扩大期刊的影响力。编辑部或期刊社采编系统在实现过程管理的基础上,应更加关注如何在编辑加工过程中利用智能化计算机系统来提升稿件采集、编审质量,而这一部分功能的开发很大程度上依赖于计算机数据库的电子信息资源技术。因此,计算机智能化编辑加工系统的开发已经成为科技期刊采编系统的发展趋势,也是科技期刊编辑出版的发展潮流。

智能化;Excel;Word;Visual Basic;宏程序;编辑加工;数据库

近年来,很多出版部门、期刊社或编辑部为进一步完善稿件管理流程,提高工作效率,均使用智能化稿件采编系统来投审、维护稿件,同时稿件采编系统是编辑、作者、读者、编委间沟通平台,也是编辑们对外交流渠道。该系统使编辑进行稿件的三审及校对加工流程更加合理化、程序化[1-2]。

期刊稿件主流智能化采编系统可实现从作者来稿到审稿环节的全流程管理,相较于传统收稿和审稿环节而言,应用优势明显。例如,利用网络采编系统后,作者通过在线投稿、网络审稿,可有效避免稿件邮寄丢失情况的发生;另外作者通过采编系统进行投稿时依据系统提示填写投稿必要信息,采编系统会自动记录并存入系统资源库,同时使来稿量和编辑加工量的统计变得方便快捷,省去了人工登记的时间,化整为零,提高工作效率。另外,期刊稿件也可通过该系统实现全文发布,提高期刊文章的阅览量及刊物的影响力。目前,针对主流智能化采编系统所提供的投稿服务,都是需要作者手动复制粘贴输入稿件所有必要信息,对于大部分医学期刊Word稿件,采编系统没有自动集成作者投稿中有效信息的功能,例如作者、单位、摘要等稿件信息的自动提取,有些大牌期刊的采编系统虽涵盖自动提取作者有效信息功能,但如果作者书写稿件格式不规范,例如稿件题目过长,采编系统就会出现稿件有效信息的漏提或错提的BUG。鉴于此项投稿工作机械、繁琐且耗时,占用了大量的时间成本,而且稿件采编系统中对于提升论文编辑质量方面的服务则相对较少,如期刊不常用数据单位信息的数据库也未建立等一系列未解决问题,如果能在现有的采编系统中整合作者稿件有效信息的自动提取功能,将极大提高稿件收集率,缩短投稿时间。因此,笔者以所在单位下属编辑部《国际检验医学杂志》为例,介绍一种巧用微软公司开发的包含协助开发环境的事件驱动编程语言VB(Visual Basic)代码或宏程序提取元数据进行整合汇总,并建立适合该医学期刊编辑部的不常见指标单位数据库的编辑方式,将采编系统中编辑加工流程与计算机软件程序做到无缝衔接[3-5]。采用这种智能化编辑加工系统功能不仅对文章数据单位的准确性进行了校对,而且提高了期刊学术质量及编辑的工作效率,减少了人工编校错误及机械重复劳动时间,实现了从投稿系统元数据提取、稿件内容信息整合到医学期刊单位数据库的建立等智能化运用,同时也实现行业期刊编辑思维重新定位和转型升级。

1 投稿系统的智能化

1.1 设计思路

作者将Word稿件投稿到《国际检验医学杂志》时,对于稿件信息例如题目、作者单位、中英文摘要、关键词等都需要一一手动输入投稿系统中,这样增加了投稿时间,降低了投稿效率。笔者查阅常用的几款文献管理软件Citavi、Mendely、Endnote、Refworks,它们均有免费提取稿件信息的功能,但鉴于软件付费版价格昂贵,很多期刊编辑工作者都会使用它们免费版。有研究者发现,该免费版系统软件会出现30%的错误率[2],例如将其稿件自动上传到Mendely、Endnote软件系统免费版或大牌期刊自带投稿自动抓取稿件Word信息系统中,若作者投稿格式不规范,稿件的第一行非题目内容且题目行数超过3行以上,就会出现跳行,采集的数据不匹配,而且某些系统软件会出现BUG即无法显示或题目显示不全。笔者通过查看该免费版系统软件的代码时发现题目的行数一般固定为2行以内,如果出现副标题或者题目字体较大且超过3行时,该系统软件就会出现BUG,因此可以采用Excel中的VB代码或宏程序来实现该系统软件技术受限的问题。

1.2 巧用VB代码和宏程序抓取投稿信息

怎样才能更加有效地提取作者的题目信息呢,这是当前需要解决的首要关键问题。笔者经过多层次的计算机代码微程序测试发现,Word稿件的题目无论书写多少行,即使中间出现空格,但最终都以“回车键”结束,而且题目行数若超过2行以上,可让系统继续自动搜索第3行及以上的题目内容。因此我们可以采用计算机系统Excel自带的VB代码采集稿件的有效信息,笔者先打开Excel系统点击查看代码调用VB代码书写器界面(见图1),书写VB代码逻辑为根据题目的第一个字加上最后的回车键来定位稿件中的题目信息。笔者经过测试的VB代码如下:

Sub SELECTION()

Dim S As String, T1, T2, i As Long, mypath As String

S = Dir(ThisDocument.Path & "*.doc*")

Do While S <> ""

If S <> ThisDocument.Name

Then

Set T1 = Documents.Open(ThisDocument.Path & "" & S)

i = 0

Do While i <= 3 '第2页已经超出标题行,这里选2

i = i + 1

S = T1.Paragraphs(i).Range

If Len(S) > 2 Then ThisDocument.Content.InsertAfter S

Loop

T1.Close

End If

S = Dir

Loop

ThisDocument.Save

End Sub

另外,其他的稿件信息由于有特殊的符号和词语,例如《国检检验医学杂志》作者单位信息都是带有括号的形式,中英文摘要、关键词都以特定词语如“摘要”或“ABSTRACT”、关键词或KEY WORDS开头,最后以该段最终的句号结束。该信息的VB代码撰写的逻辑为将变量设置成这些特定词到最后的句号,然后进行代码F5执行。其他期刊社或编辑部可根据多样本量Word稿件格式进行汇总和整理,制定固定的投稿Word格式,然后根据此稿件格式来编写或录制VB代码及宏程序实现稿件Word信息的自动提取,缩短作者投稿的时间成本,提高投稿的成功率。

图1 VB代码书写器调用

图2 VB代码调动Excel表格

2 基于自动提取稿件信息代码优化后的额外增值功能

2.1 利用VB代码提取稿件正文中元数据

笔者所在编辑部为了提高引用率在Word稿件的页尾处添加了本文引用格式,基于上述自动抓取稿件信息代码,将其优化后可提取Word格式文章的关键词,自动在排版文件的页尾处生成元数据,例如“张三,李四,赵五,等.XXXXXX[J].国际检验医学杂志,2018,39(1):1-2”。重庆大多数的期刊都是Word稿件进行编校,可以利用计算机相关软件及编程进行书写VB代码来提取Word稿件中重要的元数据“作者名字” “页码” “题目”这些字符,然后利用VB代码自动生成本文的引用格式,由于《国际检验医学杂志》在科技论文在线和本刊官网上发布的论文全部免费下载,这样可方便其他作者引用,提高本刊他引率。另外还有一种关键词的简单查找功能服务,例如重庆某些期刊采用八爪鱼或书写代码等搜索工具进行期刊元数据提取,编辑们可根据需求自行需要选取合适的方式进行元数据采集。

2.2 代码优化

根据上文的初步代码进行测试及优化,替换新的所需关键词进行查找和写入引用格式的模板中,同时参考西南片区其他期刊编辑代码,进行改写,实现Word稿件的二次功能开发。

Dim arr1 As String

Dim ii,kk As Integer

Set App1 = CreateObject( " EXCEL. Application" )

Set Book1 = App1. Workbooks. Open( " d: symbol. xls" )

Set sheet1 = Book1. Worksheets( " 医学期刊的关键词" )

App1. Visible = False

Do While sheet1. Cells( ii,1) <> " "

arr1 = sheet1. Cells( ii,2)

If ( arr1 = mytext) Then

‘在数据库中找到相应的关键词

kk = kk + 1

arr11( j) = sheet1. Cells( ii,1)

j = j + 1

End If

ii = ii + 1

Set App1 = Nothing

ii = 1

Selection. Comments. Add Range: = Selection. Range

Selection. TypeText Text: = mytext +

path = " d: equation”+ arr11(1)

‘显示出相应的关键词

ActiveWindow. Panes(2) .

Close

3 宏程序或VB代码调动数据库SHEET1

3.1 数据库SHEET1的建立

《国际检验医学杂志》由于内容涵盖医学检验实验相关内容,编辑们在审稿或稿件编辑加工中会遇到不熟悉的检验实验论文中常用的基因、蛋白、生化指标的数据单位,需要请教检验实验相关专家或翻阅文献书籍进行核实。若编辑们群策群力制作出编辑不熟悉但检验实验员常用的单位数据库——Excel表格形式(SHEET1)这样就会节约大量的时间成本,在以后的稿件Word编辑加工时,遇见不熟悉的数据单位时可利用Word稿件中VB代码及宏程序调动该数据库SHEET1来对其稿件中检验实验数据单位进行查询和验证。对于其他期刊社或编辑部也可以根据自己的需要进行汇总并制作适合本单位使用的数据库SHEET1,这样在稿件编辑加工时就可调动该数据库SHEET1,有助于科技期刊学术质量的提高。

3.2 调动数据库SHEET1的方法

调动数据库SHEET1可采用传统的Word自带功能,在“插入”里面选择“对象”,再选择“Microsoft Excel”即可或者通过以下简单VB代码调动Excel的SHEET1,该VB代码仅通过Word VB代码打开Excel小程序,调用之后的Excel界面如图2所示,代码如下。

sub Test()

dim myWorkBook as Excel.WorkBook

set myWorkBook = ActiveWorkBook

msgbox myWorkBook.application.cells(1,1)

end sub

4 PDF清样稿自动剪切及清样稿件邮件群发功能

鉴于《国际检验医学杂志》每期发送的清样稿均为PDF格式,因此需要手动剪切大量的PDF作者清样稿,而且由于给作者群发清样稿件的内容是相同的模板,如果该流程全部采用一一手动剪切PDF清样稿然后在群发作者邮箱耗时耗力。因此,笔者对智能化编辑加工系统软件VB代码及宏程序进行了多次测试与撰写,做了大量研究调查并提出利用Excel宏程序调用Outlook系统群发清样PDF附件的软件小程序,实现作者清样稿件自动剪切和清样稿件的群发功能[6-8]。其他医学期刊社利用的MAILplus.RAR进行群发稿件等新模式都可打破传统的手动输入模式,采用小程序软件系统提高编辑们的时间成本。

5 结束语

本文详细分析和总结了目前期刊社或编辑部在内容资源深度加工的程度、内容资源表现形式、信息延伸的范围、个性化定制、内容资源承载载体等方面的编辑加工特点,旨在找到适合国内医学期刊编辑加工新途径。分析表明,目前国内采编系统还有些尚未解决的技术问题:信息纠错能力较差、数据库只采集常用数据单位信息、不能自动提取作者投稿有效信息[9]。此外,目前国内大部分科技期刊采编系统对传统出版的内容资源缺乏整合和深度加工,无法把它们开发成可以再利用的产品有针对性地供医学期刊编辑使用,难以满足人工智能时代下对编辑的新要求。“利用Excel的宏程序及VB代码对Word投稿稿件二次功能的开发”角度对元数据进行搜索、内容进行重新组装,采用根据医学期刊个性化定制不常见指标单位数据库及医学类期刊关键信息的提取等编辑加工新模式,针对主流采编系统开发实用型编辑加工小程序是目前亟待解决的问题[7,10]。

[1] 黄莘,漆蓉,税红,等.稿件采编系统的操作分析[J].编辑学报,2008,20(2):153-154.

[2] 张晓丽,武文.稿件采编系统在期刊联合编辑部的应用实践与探索[J].编辑学报,2012,24(3):272-273.

[3] 刘铁英,黄春燕,熊光欣,等.基于WORD VBA的作者单位名称快速修订方法[J].编辑学报,2013,25(1): 76-78.

[4] 陈庭木,徐大勇,秦德荣,等.偏相关与通径分析的EXCEL VBA 程序设计[J].农业网络信息,2007(3):101- 103.

[5] 喻革武.EXCEL中VBA编程语言的命令介绍及编程[J].电脑学习,2001(4):30-31.

[6] 周丽.分割PDF文件的几种常用方式[J].新闻研究导刊,2015(12):353-354.

[7] 高飞,李彦春,尹世堂,等.大学学报稿件管理系统流程分析与软件开发[J].中国科技期刊研究,2010(5): 518-521.

[8] 周丽.outlook系统在编务工作中应用探析[J].出版与印刷,2014(2):15-17.

[9] 刘岩,刘鹏.应用VB和Access数据库设计开发学报稿件管理系统[J].中国科技期刊研究,2010(3):339- 342.

[10] 梁建隽.VBA 编程与函数应用的比较[J].兰州交通大学学报,2012,31(6):94-96.

苏 畅,E-mail: 2442103004@qq.com

猜你喜欢
宏程序代码稿件
录用稿件补充说明
本刊稿件体例要求
本刊稿件体例要求
本刊稿件体例要求
椭球槽宏程序编制及其Vericut仿真
用修正渐开线投影法螺旋铣球面宏程序的编制
创世代码
创世代码
创世代码
创世代码