LaTeX与Word文件的相互转换

2014-03-26 01:17马加佳
中国科技期刊研究 2014年3期
关键词:数学公式编辑器命令

■马加佳

杭州师范大学学术期刊社,浙江省杭州市余杭区仓前街道海曙路58号 311121,E-mail:majj109@163.com

目前国内科技出版机构投稿以Word文件为主,而随着与国际的接轨,也有不少作者使用LaTeX(中文套装版本为CTeX)撰写论文,特别是数学论文[1],并以LaTeX生成的PDF文件进行投稿。如果编辑部本身使用Word排版系统,而收到的稿件是LaTeX文件(或者是由LaTeX生成的PDF文件),则通常的做法是要求排版人员或作者使用Word重新排版,这样非常耗时耗力;同样,如果编辑部本身使用LaTeX排版系统,在接收到Word稿件时,那么也需要面临将Word稿件用LaTeX重排的困境。为了解决这一问题,下面介绍两款软件——TeX2Word与Word2TeX,这两款软件能够迅速将 Word或LaTeX文件互相转换,从而减少重排时的工作量,提高排版效率,为排版人员或作者提供帮助。

1 Word与LaTeX概述

Word是众所周知的排版软件之一,其最大的特点是“所见即所得”,因其方便、易于操作而拥有大量的用户。而LaTeX是一种基于TeX的排版系统,从严格意义上讲并不是一种软件,而是一类格式化排版程序[2],是在TeX语言上发展起来的一种更加方便、强大的宏命令包,通过排版程序对LaTeX源文件(.tex或者.ctx)进行处理并将结果传到输出设备,其最大优点是开源和高质量的输出(常见输出格式为PDF文件)。虽然TeX系统是目前公认的数学公式排得最好的系统,但其排版命令繁琐,源文件可读性差,用户不易掌握。这两种排版系统各有千秋,而在排版高质量科技书籍或论文,尤其是含有大量数学公式的科技论文方面,LaTeX更受到科技学者的青睐。国际上许多著名出版机构也都推荐或要求使用LaTeX投稿,例如荷兰爱思唯尔公司、德国施普林格公司等。

2 TeX2Word与Word2TeX软件简介

2.1 TeX2Word

TeX2Word软件可以将TeX/LaTeX文件转化为Word文件。LaTeX源文件是ASCII码的文本文件,本身并不能像Word一样实现“所见即所得”,需要运行程序编译成PDF文件,才能显示如同Word一般的排版效果。也有人尝试利用PDF转Word的软件(如PDF2Word)将LaTeX源文件生成的PDF文件转换为Word文件,但由于PDF格式与Word格式解码不同,所以对于科技论文尤其是数学类论文,转换效果都不理想,即使可以转换一部分文本,也会丢失所有数学公式,出现大量乱码,排版混乱。那么,最可行的途径还是直接由LaTeX源文件转换成Word文件,而TeX2Word恰好是目前LaTeX源文件转换成Word文件的最好软件。

2.2 Word2TeX

Word2TeX软件可以将Word文件转化为TeX/LaTeX文件。即使没有学习过LaTeX也可以编写LaTeX格式文章,作者可以先用Word撰写论文及书籍,使用Word自带公式编辑器或MathType编辑器编写公式,插入图形或建立表格,再通过Word2TeX软件将其转换成LaTeX文件,而不需要重新输入LaTeX命令来编写数学公式。转换后只需做一些命令的调整,就可以编译生成与原Word内容基本一致的PDF文件。

3 TeX2Word软件的使用及转换效果

3.1 安装及使用说明[3]

(1)操作系统必须是Windows XP SP2及以上;已安装MicrosoftWord/Office(32位);如果版本低于Word/Office2007,则必须安装MathType数学公式编辑器4.0以上;硬盘空间不小于100 M。

(2)下载并按提示安装TeX2Word软件(官网地址 http://www.chikrii.com/products/tex2word/)。

(3)运行 MicrosoftWord,点击“文件”→“打开”→“文件类型”下拉菜单中选择“TeX”格式。

(4)选择待转换LaTeX源文件,点击“打开”,跳出对话框选择“是”,出现转换界面,点击“OK”,另存为“.doc”文件,即可得到转换后的Word文件。

注:即使电脑上未安装LaTeX相关软件,也可以进行以上转换操作。更方便地,可以直接右键点击待转换 LaTeX源文件,选择“打开方式”为“MicrosoftWord”,点击“确定”即可转换 LaTeX为Word文件。如果LaTeX源文件的后缀名是“.ctx”,则只需将后缀名改为“.tex”,再进行如上步骤。

3.2 转换效果

衡量LaTeX转换成Word是否成功的关键在于,其转换后的文件内容是否可以跟源文件编译的PDF文件内容保持高度一致。而事实证明,TeX2Word能转换LaTeX中的绝大部分中英文文本,而不出现乱码,且对于数学公式的转换效能也非常出色。

图1给出了TeX2Word对于常用数学符号的转换情况。从图中可见,经TeX2Word转换后的Word文件中的数学符号基本与由LaTeX生成的PDF中的数学符号一致,少数符号出现了乱码(图1中显示为“?”)。哪怕是较为复杂的数学公式,转换效果也很理想,如图2所示,公式中的希腊字母、运算符、上下角标等,在转换过程中,未发生偏差。进一步,我们选取文献[4-5]LaTeX源文件的部分编译命令,制成一个精简的数学论文LaTeX模板,来看一下TeX2Word软件对于整篇LaTeX文件的转换效果,如图3所示(LaTeX源文件略)。比较发现,经TeX2Word转换后的整篇 Word文件(图 3b),与LaTeX源文件生成的PDF文件(图3a)相差无几,不仅保留了绝大部分文本信息,而且也没有丢失数学公式。即使LaTeX源文件是中英文混排,其中还包含方程组、矩阵、复杂多排公式等,也都不影响转换。虽然转换成Word后在排版格式上(如字号、字体、位置、间距等)会有些许改变,但只需后期再稍微调整一下即可,这就极大地减少了重排版时的工作量。

其中需要注意几点:1)转换过程中有一些LaTeX语句Word无法识别,会导致编译陷入死循环,造成转换失败,这时只需在LaTeX源文件中修改或删除这些无法识别的指令,再运行TeX2Word进行转换。2)TeX2Word只能转换常见数学符号(图1),对于LaTeX中Amssymb宏包里的数学符号无法进行转换。3)因为作者撰写的LaTeX模板不同,所以转换后Word文件中会多出一些LaTeX语句(如字号、间距等命令),重排时需要删去这些语句。

4 Word2TeX软件的使用及转换效果

4.1 安装及使用说明[6]

(1)操作系统必须是Windows 95以上;已安装MicrosoftWord 95以上版本;硬盘空间不小于10 M。

(2)下载并按提示安装Word2TeX软件(官网地址 http://www.chikrii.com/products/word2tex/)。

图1 TeX2Word软件对数学符号的转换效果

图2 TeX2Word软件对复杂数学公式的转换效果

图3 TeX2Word软件对整篇LaTeX模板的转换效果

(3)安装完成后Word2TeX会自动嵌入Word,打开需要转换的Word文件,然后点击“文件”→“另存为”→“保存类型”中选择“.tex”格式→属性框(图4)中点击“确定”,即可完成转换。

注:默认设置下(每次转换文件时都会弹出该属性对话框),输出版本为LaTeX 2e(与旧版LaTeX 2.09区别主要在于导言、公式及样式命令),输出文件编码为ANSI码(Windows系统下),采用 UNIX/Windows系统下的换行字符LF,且能够识别文本中的内嵌公式。

图4 Word2TeX转换属性框

4.2 转换效果

在对属性框默认设置不做修改的情况下,Word2TeX能够迅速转换Word文件中的文本信息。而且,由于Word公式编辑器(或者MathType编辑器)自带的translator选项本身就提供了向 latex/amslatex格式转换的功能(只针对单个公式),所以Word2TeX能够非常完美地批量转换这类编辑器创建的一系列数学符号及复杂公式。此外,我们还可以通过对属性框子菜单的进一步设置,如转换文本颜色、字号等(图4),获得更为理想的转换效果。选取一篇含有数学公式[7]、表格及图片的中英文混排Word文件(图5a),经Word2TeX转换(其中属性框设置稍作修改),得到LaTeX源文件(略),编译生成PDF文件(图5b)。两者对比发现,除了排版格式上的不同,如字体、标题位置、图表样式等,显示内容基本一致,这说明Word转LaTeX文件是比较成功的。

其中需要注意几点:1)对于中英文混排的Word文件,转换成LaTeX文件后,如果直接编译会丢失中文文本信息,因此,在LaTeX文件导言部分需要使用CCT预处理(如输入命令documentclass{cctart}),或者调用CJK宏包,以便排版中文。2)默认设置下,Word中的图片转换成EPS格式,直接编译可能会丢失图片,为解决EPS图片插入问题,可在源文件导言部分调用usepackage{epstopdf}宏包;另外,图片文件名中如果出现中文会导致编译失败,需重新用英文或数字命名。3)原Word文件尽可能使用适合的段落样式排版(如利用“样式与格式”菜单设置章节标题),这样转换出来的LaTeX文件中也将包含标题命令,如“section{标题一}”,否则将转换成不带标题命令的普通文本。4)利用Word公式编辑器(或者MathType编辑器)编辑的数学公式内不能含有中文,否则转换后会丢失中文信息;数学公式编号必须加括号(英文半角),如“(1)、(1.1)”,而不能表示为“1-1”,否则,将转换成普通文本而不是LaTeX的编号命令。

图5 Word2TeX软件对整篇Word文件的转换效果

当然,Word2TeX转换属性框的设置毕竟是有限的,Word2TeX转换出来的也只是一个简单的LaTeX模板,仍然无法达到一些用户的更高要求。所以为了获得更好的转换输出效果,推荐做法是先选取一个特定模板(一般利用LaTeX排版的编辑部都会提供自己的LaTeX模板),通过Word2TeX将Word转换成LaTeX文件,再将转换后的内容(LaTeX语句)分段复制粘贴到给定LaTeX模板中的相应位置。每个模板都对字体、字号、章节段落等格式化排版命令做了严格规定,而分段粘贴能够确保正文内容上的准确性,也避免了对模板格式命令的改动,不会对输出版式造成很大影响,只要对局部命令稍作调整后再进行编译,即可很快实现LaTeX重排。

5 结语

使用TeX2Word与Word2TeX软件,能够最大限度地实现Word与LaTeX文件的快速转换,这为排版工作带来极大方便。收到的稿件不论是Word格式还是LaTeX格式,都可以根据编辑部排版系统的要求,选择这两款软件其中之一进行转换,从而得到所需的稿件格式。虽然转换中会出现一些问题,但在很大程度上减少了重排时的工作量,提高了排版效率。

1 王勇,姚萍,王岚等.LaTeX与方正书版排版数学论文探讨.中国科技期刊研究,2012,(6):1036-1039

2 李平.LATEX 2e及常用宏包使用指南.北京:清华大学出版社,2004

3 Chikrii Softlab.TeX2Word User Manual.http://www.chikrii.com/dl/tex2word/tex2word.pdf

4 马彪.Boole环的推广.杭州师范大学学报:自然科学版,2013,(1):61-64

5 韦宝荣.关于一般化的绝对Cesáro求和.杭州师范大学学报:自然科学版,2013,(1):45-49

6 Chikrii Softlab.Word2TeX User Manual.http://www.chikrii.com/dl/word2tex/word2tex.pdf

7 Chikrii K A,Chikrii A V.Linear Differential Games of Persuitwith Integral Block of Control in its Dynamics.http://www.chikrii.com/products/word2tex/samples/article.doc

猜你喜欢
数学公式编辑器命令
形神兼备,聚焦小学数学公式定律教学策略
只听主人的命令
司空见惯感觉烦 锁屏画面快走开
你距离微信创作达人还有多远?
数学难题解开啦
车辆段收发车运行图编辑器的设计与实现
移防命令下达后
这是人民的命令
活用数学公式 优化数学课堂
巧拼火柴棒