曹长香
[摘 要] 在数据价值日益提升的背景下,学术出版中的图表数据内容明显增多,文字编辑的加工整理工作被赋予新的挑战和责任。本文探讨学术出版中各种典型和常见的图表数据问题,提醒责任编辑在处理图表数据类书稿时需要关注的各种问题,通过典型案例分析问题的种类及成因,并指出图表数据中可能隐藏的政治问题。
[关键词] 学术出版 图表数据 数据核对
[中图分类号] G232 [文献标识码] A [文章编号] 1009-5853 (2015) 04-0039-04C
进入21世纪以来,随着知识经济的发展和信息技术的进步,以及各行各业的全球化规模化发展,产业连续增长的数据积累对于总结分析各种信息、研判未来,具有重要的经济学术文化价值。社会各方面的发展进步反映到学术出版领域,就是近年来注重行业、专业数据积累的图书选题比例明显增加。
基于数据积累在学术出版中价值的提升,书稿中需要编辑处理的图表数据内容明显增多。由于数据来源的复杂性以及作者对数据使用方式的多样性,图表数据类稿件中存在的问题多种多样。编辑只有具备足够的耐性和观察力,掌握一定的技巧,遵循一定的方法步骤,才能梳理修正各种问题,解决由于各种原因遗留的疏漏问题,尽可能消灭硬伤。本文主要从文字编辑的角度,总结分析数据类书稿的编辑处理方法及需要注意的环节,以提高工作效率和编辑质量。
1 图表数据典型问题及其编辑加工
由于学术书稿的写作过程很长,涉及数据信息庞杂,作者又会随着实际情况的发展变化和研究思路的调整改进对数据和文字进行反复修改整理,这就导致作者交到出版社待编辑处理的原稿,可能出现多种与数据有关的问题。因而,只要书稿正文涉及数据,不管它与图表内数据是否有关系,都需要编辑注意审核,从不同角度仔细核对、计算可能存在的错讹。
1.1 文、图中的数据本身有错误
当书稿的文字表述涉及权威部门发布的数据或比较完整的调研数据,并将总数据和比例变化连续罗列出来时,编辑需要注意检查核算数据本身是否有错,尤其是一些总量指标的年度变化百分比,如果连续几年的总量和变化量都有,就一定要计算核对。例如,下列材料中连续罗列了五年的广东茶叶出口数据,如果编辑不进行核对计算,就不会发现第一个18.7% 是错的,应该是18.1%。
据《广东统计年鉴》,2005年广东出口茶叶13795吨,同比大幅下降40.46%;2006年出口茶叶11293吨,同比下降18.7%;2007年出口茶叶9181吨,同比下降18.7%;2008年广东出口6334吨,同比下降31%。
正文和图表中的调研样本总数和各部分的比例数也容易出错,必须仔细核对准确。比如图1,要确保图中各个数据准确无误,先要算出图中总人数219+85+45+20+131=500人,然后再核对各比例数值是否正确,最后还应检查核对图中数据与正文文字表述是否一致。饼图最常见的错误是各部分比例之和不等于100%,所以,编辑在加工饼图的百分比数据时一定要计算一下各部分比例之和,如果不等于100%,就一定要退作者重新核实。这类问题稍微留意质疑一下不难发现,关键是要有这个意识——角角落落都有错的可能。
图1 饼图比例问题
可见,有些错误仅仅通过核对图表数据与对应的正文不一定能发现,还需要检查图表本身,需要从数据来源、资料来源或者排版制作环节找原因。此时,编辑的作用就是发现问题、提醒作者核实修改,并进一步完善。图表数据较多的书稿,从上下文到图里图外、表里表外都容易出问题,没有一定的经验基础进行全面核查,这些问题难免有遗漏。因而,就书稿中的数据问题多与作者沟通,培养、指导作者队伍形成良好的数据处理习惯,从源头上遏制数据漏洞,才是减轻编辑工作负担的根本方法。
1.2 表题、图题及图表说明等与图表数据内容不符
图表文字差错,如表题、图题表述与图表内容不一致,图表中的各组成元素如图例文字、图题、表题不规范或有错误,也容易被遗漏。因此,编辑在加工图表时,即使是文字很少的结构图、图标图例、图题、表头和表题,不仅要核实图表中的数据是否准确及与正文是否对应,也要注意核实表头、表题、图题与图表数据内容是否相符,图例是否准确。注意不要顾此失彼,不要仅仅重视文字比较集中的大表大图,忽视表头、图题、图例。
1.3 核实图表数据是编辑加工的基础工作
图表数据是容易出错的地方,而且一旦出错,就是硬伤,无可辩驳。处理图表数据类书稿,必须重视数据核实整理工作。例如,社会科学文献出版社有较大影响的皮书系列,尤其是行业皮书和财经类皮书,有行业或学科年度数据积累功能,因其注重应用统计学、社会学等研究方法,不少书稿中有较多的图表数据,需要编辑对其形式、内容正误进行核对整理。本文也正是笔者对数据类皮书书稿中各种常见错误的一个归纳总结。
如表1,表中的收入合计数和最后两列的比例数是通过表内数据计算出来的,经常有错讹,编辑必须重新核算,以便确认是否需要作者检查核对原始数据。表中的数据单位也是经常出错的地方,如表1中有两种不同类型的数据——总量数据和比例数据,单位应该是两个——万元、%,不应只是“万元”。
表1 内、外资服务业税收收入情况 (单位:万元)
因而,编辑要明确,图表中的数据必须重新核算,依靠“文责自负”或“数责自负”恐怕过不了关,因为作者和编辑考虑同一问题的角度是不一样的。作者往往侧重创作思路和文献梳理,对于他们最终提交作品的呈现方式、表现形式,编辑一定要检查。尤其是当同一数据或相关数据间断地出现在不同页面上时,必须注意对上下文相关数据的核算或核对,只有勤跨页来回翻查比对才能消灭数据纰漏。
核对数据需要有很大的耐性,一个一个核对,不能有半点马虎,尤其在庞大的表格、大量的数据面前要按捺得住。从编辑的角度,虽然不便查找原始数据或数据来源,但检查形式是否正确就足以发现不少问题,通过简单的加减乘除计算,经常也能发现总和数、百分比数是错的。发现错误后,编辑可将问题反馈给作者,让作者确认准确数据,这正是责任编辑的职责所在——增强学术作品的严谨性,让细节经得起推敲。因而,从编辑的角度检查数据问题,直接的目的虽是为了通过图书质量质检关,但在客观效果上可以帮助作者查漏补缺,完善学术成果的表现形式。
1.4 小 结
表中、图中数据尤其是很多大表格中的数据需要从多个角度核对,稍有疏忽遗漏即可能出错,而且可能造成连锁反应——以此为基础的数据必然出错,并导致相应的文字表述出现偏差。所以,对于全书数据源类的大表格,必须认真核对,不能偷懒,而且要有足够的耐心,要把数据核实准确,为后面的分析提供扎实可靠的依据。
要处理好书稿中的数据问题,必须寻求高效解决问题的方法。常用的方法是具体问题单独解决,一遍只解决一个同类问题,如标题级别、图表序号、图表数据和单位规范性等,这样容易达到高质量、高效率、无遗漏。如果经常编辑同类书稿,熟悉各种情况下的问题类型,也可以根据书稿特点确定解决问题的方法,可以一遍同时解决多项任务。例如,书稿中需要解决的项目比较多,而且比较有规律,处理时就可以实现流程化,按部就班,一项一项落实到位,不遗漏项目,也能保证准确率。
2 图表数据问题来源例析
2.1 作者易疏忽遗漏的问题
(1)遗漏数据。如图2,作者提供的原图中只有趋势线,缺少横纵坐标轴的具体数据,使整幅图的表意非常模糊,失去了图表数据具有直观价值的依据。若不提醒作者补充,就会将瑕疵留在出版物中。
图2 国籍构成变化
(2)遗漏纵轴或横轴的数据单位。缺少数据是失误,漏掉数据单位同样不能精确显示图表的具体意义和价值。书稿插图中横纵轴都没有标注单位的情况很常见,也很容易被忽略。表格中此类问题也不鲜见,尤其是当表中数据类型较多时,表格缺数据单位或漏某项数据单位的情况经常出现。编辑在书稿出版印刷前,必须将这些遗漏补充完整。
(3)坐标轴数据格式错误。例如,增长率变动趋势一般用百分数表示,标注单位为百分号(%),要注意纵轴数据不应是小数而应为整数,这不仅是要符合增长率的常见表示方式,也是为了与全书同类图表的格式实现统一。虽然纵轴的小数从数值大小来说与整数表示是一样的,但不符合常规,应统一为整数百分比形式。
(4)遗漏项目。例如,图题中有明确的项目数,某些确定数目如31个省份的得分散点图,但图中可能只有30个省份,缺了一个。这种错误有一定的隐蔽性。
(5)纵轴单位标注不妥。当同一坐标轴内有多个对比项目且单位不同时,可以用双纵轴曲线图或折线图来显示,以明确区别不同的单位,不宜只用一条纵轴。例如,妇女总和生育率这个指标的单位是“人”而不是“‰”,因此,在同一张图中如果只有左侧一条纵轴显示总和生育率、出生率、死亡率、自然增长率等指标就不太合适,需要在右侧补充一条纵轴,左侧纵轴单位为“‰”,右侧纵轴单位为“人”,这样区分就比较明确了。
图表的内容与形式内涵非常丰富,可以通过各种形式创新满足内容表达的需要,从而充分体现作者的创意和作品的学术价值,这是图书内容生产的客观需要。具体到书稿编辑环节,就需要特别注意承载丰富内容与形式的图表可能存在的问题,图表是容易扎堆出错的地方,一张图表可能有多个错误,编辑必须熟练把握各种可能出错的情况,把问题彻底解决干净。
2.2 排版人员易生成的制作错误
有些图表数据错误是由排版制作人员造成的。在把作者提交的Word文件转化为排版文件的过程中,通常需要重新制作各种图表,这时就可能出现数据或文字录入错误。
(1)图例不对应。如图3,柱状图中分别用竖纹、横纹等区别上升、下降和保持三类指标的个数及其所占的比例,作者提供的该类图一般问题不大,问题经常出在排版制作环节。因为制作人员在重新制作此类图时,选用的柱图底纹可能与作者原稿中的竖纹、横纹略有不同,加上制作人员不知道书稿内容,就容易出现三类指标数量与比例的不对应或者顺序混乱,把柱状图各部分的底纹或灰度深浅填反了。这就需要编辑对各类指标的数量与比例进行具体核对,纠正制作过程中产生的混乱和错误。
图3 创新指标动态变化结构
(2)数据不对应。这是一种常见的错误类型,如表格中的数据与图中数据点为一一对应关系,但经常出现图中数据与表中数据不对应或者图中数据与坐标轴上的刻度位置不对应的问题。这类错误不复杂,关键在于编辑是否将表中数据与图中对应各点逐一核对检查。如表2数据与图4中的折线点数据是一一对应的,图4将表2中的数据以折线图的形式展示出来,但制作出来的图中数据点与表中数据经常“对不上号”。容易出现同类问题的还有柱状图、雷达图等。碰到此类图表,编辑需要将原数据与图中数据点仔细比对,并检查折线图、柱状图、雷达图上的数据点与坐标轴上的刻度位置或大体范围是否对应。
表2 2001—2009年金砖国家创新竞争力得分变化
图4 2001—2009年金砖国家创新竞争力评价分值变化趋势
3 数据统计中的政治问题
这类问题不常见,但需要格外注意,尤其是外国人或来自国外政府或学术机构的数据,其政治立场或观点会体现在统计数据中。比如,由于中国港澳台某些历史时期在管辖归属上的特殊性,外国人在图表数据或者文字表述上,会把香港、台湾列到中国之外,香港、台湾的数据经常是不与大陆数据一起统计的。这种情况下,编辑一定要注意检查描述图表的对应文字的表述是否有问题。如对表3的文字表述,“三种中国籍准定住者中,‘日本人之配偶等规模最大,为43771人”,如此表述,实际上没有把来自台湾的中国籍准定居者算上。不管外国人这么表述是无心之失,还是不怀好意或者是恶意从数字文字上图谋分裂中国,作为专业编辑必须发现问题,弄清楚中国籍准定居者“日本人之配偶等”人数为46317人,而不是43771人。
表3 广义在日华侨的人口规模和构成(2012年12月) (单位:人 )
另外,对一些比较特殊的国家数据及其文字表述要提高警惕。例如朝鲜,其与韩国的历史现实关系会体现在某些国家似乎很“客观”的数据中。这类细节问题,是需要质疑才能发现的,不然很容易遗漏。比如,“中国(32.5%)、韩国和朝鲜籍(26.2%)、巴西籍(10.1%)、菲律宾籍(10.1%)、秘鲁籍(2.5%)、美国籍(2.4%),这6个国籍的外国人占了在日外国籍人口总数的83.8%”这段话中,“6个国籍”很明显是把韩国和朝鲜当作一个国家来统计了,把民族与国家混为一谈,此处最好改为“6个来源地”或“7个国家”。编辑要当心这种情况可能被小题大做,不小心会变成外交事件。
4 结 论
在当今数据价值日益提升的时代,书稿中的图表数据以其灵活、直观、明确的表现形式与文字表述相辅相成,使学术研究成果更加清楚明了地呈现出来,功能不可小觑。协助作者准确、科学、规范地使用图表,修改可能存在的各种数据问题,优化学术成果表现形式,是编辑的基本职责。这就要求编辑熟练掌握图表的结构、特点、形态样式及规范要求,全面规范处理图表中的数据来源、数字错讹以及量和单位等问题。
(收稿日期:2014-07-25)