李新安
摘 要 论文初审是现行期刊的初审、外审、终审的“三审制”中重要的环节。而稿件登记和汇总又是初审入口关,在分析稿件登记和汇总目前存在工作量大、容易出错等问题后, 设计了稿件登记智能化流程,采用Python软件设计了代码。在实践中运行成功,保证了准确性,提高了工作效率。
关键词 期刊;稿件登记;编程
引言
期刊的论文撰写和发表是为了交流、传播信息,目的是要同行认可并利用,通过符合标准和规范的编排使读者能顺利地阅读、迅速而方便地了解和利用论文的内容[1]。为此论文的作者和编者都应按照科技期刊的要求,遵循规定的格式,科技论文的基本要素包括:文章题名、作者署名、作者单位、摘要、关键词、引言、正文、结论、参考文献等。但编辑部经常收到的论文缺部分要素,有的论文没有参考文献,有的文章甚至没有作者姓名和作者单位,给编辑部稿件登记和初审带来不便[2-4]。同时为了统计和以后工作的快捷,稿件的登记常采用Excel表格,目前大多数文章是Word文档。编辑部收到的稿件放入一个文件夹,有的期刊一周能收到好多文章,登记文章时,逐步打开Word文档,把题目、作者、单位等复制和粘贴到Excel表格中,工作量大,也容易出错。笔者在某编辑部实习期间,发现采用编程和爬虫技术,可以把收稿文件夹中的Word文档论文的要素提取出来,自动生成到Excel表格中,大大提高效率和准确性,为编辑部的办公智能化提高发挥了一定作用。
1稿件登记智能化流程设计
根据以上采用Visio设计的工作流程如图1所示。
2采用Python编程
具体的编程代码如下:
from win32com import client as wc
import os
from docx import Document
import pandas as pd
def doc_to_docx(dirpath,path):
file = dirpath + ‘\\ + path
word = wc.Dispatch(‘word.Application)
doc = word.Documents.Open(file)
doc.SaveAs(file.replace(‘.doc,.docx), 12) # 12表示docx格式
doc.Close()
word.Quit()
os.remove(file)
return file.replace(‘.doc,.docx)
def get_data(dirpath):
for root, dirs, files in os.walk(dirpath):
result_list = []
for i in files:
try:
result_dict = {}
text = []
if i.endswith(‘.doc):
file_name = doc_to_docx(dirpath,i)
document = Document(file_name) # 打开文件demo.docx
for paragraph in document.paragraphs:
c = paragraph.text.replace(‘ ‘,)
if c != ‘:
text.append(c) # 打印各段落内容文本
elif i.endswith(‘.docx):
document = Document(dirpath V ‘\\ + i) # 打开文件demo.docx
for paragraph in document.paragraphs:
c = paragraph.text.replace(‘ ‘,)
if c != ‘:
text.append(c)
result_dict[‘稿件名称] = text[0]
result_dict[‘作者] = text[1]
result_dict[‘作者单位] = text[2].replace(‘(‘,).replace(‘),)
num = 0
for i in range(len(text)):
if ‘寄刊 in text[i]:
result_dict[‘参考文献数量] = text[i-1].split(‘])[0].replace(‘[‘,)
result_dict[‘手机号码] = text[-1].split(‘:)[1]
result_list.append(result_dict)
except Exception as e:
print(e)
with open(‘err.txt,w) as f:
f.write(i)
pd.DataFrame(result_list).to_excel(‘收稿件登記簿.xls)
print(‘程序结束)
if __name__ == ‘__main__:
dirpath = input(‘请输入存放word文件的绝对路径\n)
# print(dirpath)
get_data(dirpath)
运行后生成的Excel表如图2。
收稿件登记簿生成的是Excel格式,便于用于以后本期刊的统计分析,比如作者单位统计,可以看出那些单位投稿的文章数量多,高校的文章和科研院所文章投稿数量对比,及参考文献数量汇总及平均引文数量统计等等,以此Excel文档为基础,还可以扩展应用到稿酬计算和给作者寄刊汇总的方面,大大节省编辑的录入时间,提高了工作效率。
3结束语
在期刊现行的初审、外审、终审的“三审制”中,初审是控制稿件质量的入口,是把握刊发论文学术质量的第一道防线,而稿件登记是编辑部论文初审环节中重要的一环。针对这个环节,设计稿件登记智能化流程 ,并用Python软件编程,自动生成的Excel文档,便于汇总、统计、分析,提高了编辑部工作效率。
图2 自动生成的Excel表格界面
参考文献
[1] 陈浩元.科技书刊标准化18讲[M]北京:北京师范大学出版社, 1998:101.
[2]张建合.学术期刊编辑初审探微[J].编辑学报,2003,15(1):23-26.
[3] 居自强.科技期刊编辑应做好文稿的初审工作[J].编辑学报,2005, 17(1):58-59.
[4] 沈玲.高校学报编辑初审探微[J].吉林省经济管理干部学院学报,2010,24(6):81-84.