科技论文中统计图的审查与优化

2018-12-25 05:50徐婷婷曾礼娜
学报编辑论丛 2018年0期
关键词:可读性统计图表格

徐婷婷,曾礼娜



科技论文中统计图的审查与优化

徐婷婷,曾礼娜

(《厦门大学学报(自然科学版)》编辑部,福建 厦门 361005)

通过分析科技论文中的统计图进行编辑加工时遇到的常见问题,从准确性、科学性和可读性三方面论述如何审查和优化统计图形式与内容的统一。准确性的审查须重点注意图文数值的差错、统计分析的疏漏以及图线描述的片面问题;科学性的考量主要关注图形样式的选择和坐标的设置是否合理;可读性的优化则一般从图线的区分度和分组的空间邻近角度出发以呈现更直观的差异。探讨实现统计图形式与内容高度的统一性对编辑的数据观察力、内容理解度和细节敏感性提出的要求。

统计图;科技论文;内容

在科技论文中,许多自然科学类实验常常涉及大量的统计数据,图表是呈现数据结果的重要形式,因此统计图表也是这些论文主体内容的重要组成部分,与结果的文字叙述与分析有着相辅相成的紧密联系。为了更好地将作者提供的图表呈现给读者,前人对于科技论文中图表的加工与校对已经进行了一些经验总结,提出了一致性、规范性、自明性、美观性4个原则[1],并分享了规范、科学地编排图表的相关技巧[2]。近年来,针对科技论文中表格的设计及数据统计分析,许多研究从科学性和规范性的角度对一些案例进行了细致的剖析,包括有效数字的修约、统计学检验结果的标注、表题和栏目的设计等[3-7]。其中对于表格数据的科学性,要求认真核查数据并注意表格形式与内容的一致性[3];在表格的可读性方面,应当保证读者能方便且一目了然地阅读到内容中的对比项信息[5];从表格的整体编修原则上来说,须兼顾简约性和表现力,提升精编表题和简化结构的技巧[6]。然而关于科技论文数据结果的另一重要呈现方式——统计图,如何实现其形式与内容的统一性问题,目前探讨得还不多。

鉴于此,本文参考编辑同仁们的经验,结合笔者自身的学科专业背景,通过归纳在编辑加工统计图及与之相关的文字内容时发现的一些问题,从准确性、科学性和可读性三方面分析如何审查和优化统计图形式与内容的统一,在此基础上探讨实现这种高度统一性对于编辑的职业素养和专业水平提出的要求。

1 统计图的审查与优化

1.1 数据分析的准确性

与表格相比,统计图在呈现大量数据时更为直观,对于读者而言可以在更短的时间内了解数据的整体情况,进而更有效地获取数据结果反映的内容信息,因此被使用得比较广泛。但从作者的角度来看,表格的形式更接近原始数据记录,而统计图则需要在原始数据的基础上通过相应的绘图软件进行二次处理,往往增加了出错的概率。因此,编辑加工和审读统计图时更应注意核查数据的准确性。

1.1.1 图文数值

统计图中数值与正文描述不一致是科技论文的数据内容部分中最基本的一类差错,这主要是作者在整理数据或写作阶段直接的录入错误导致的,常见的情况如各项百分数累计总和不为100%,误差线范围与坐标轴数值差不对应等。基于上述问题,为保证数据内容描述的准确性,需要编辑对图文数据的一致性进行细致核查,这也是数据审查的基本功。

1.1.2 统计分析

在统计图的绘制中,统计学标注很重要,也经常出错。这主要是作者没有使用正确的统计分析方法或后期标注错误导致的,其中较易被发现的是差异显著性分析的错误。关于这一问题,编辑同仁们对统计图表中显著性检验方法及标注的规范性已提出了一些很好的建议,并特别强调了使用字母标注时应注意顺序、符号与格式的统一等细节[8-10]。笔者在编辑加工过程中还发现,一些作者存在对统计学分析结果描述的错误,特别是在涉及多组数据的比较时,常出现对个别项目描述不准确或遗漏的问题。图1为涉及多组数据之间进行比较的统计分析示例,分别显示存在和不存在砷(Arsenic, As)胁迫的条件下,3个不同水平的硫(Sulfur, S)处理组幼苗叶片中的谷胱甘肽(GSH)含量。作者采用了不同英文小写字母的方式,分别标注相同条件下3个处理组数据间的差异显著性,并用a, b, c和a’, b’, c’区分开2种条件,图形展示上很明确;但正文描述为“+As组幼苗叶中GSH含量随着S处理水平的升高先升高后下降,且GSH含量在-S、+S和+HS处理下均高于-As组”。对照图形来看,黑色(+As)柱形“先升高后下降”的变化趋势描述与差异显著性分析结果相符,但“+HS”处理对应的黑(+As)白(-As)两柱形高度差异却并不显著,故要求作者再次核查数据的统计分析结果,后证实原文描述存在错误,将后半句修改为“且GSH含量在-S和+S处理下均高于-As组”。因此,笔者认为在审查统计分析结果时,应特别注意包含大量数据的统计图中差异显著性分析是否合理,各项是否做到图文相符,对于与正文描述不一致的差异分析结果,要主动提出质疑并提醒作者进行核查。

图1 多组差异比较示例

1.1.3 图线趋势

在分析统计图的数据结果时,还经常会涉及对图线趋势的描述,在这一过程中常出现的是作者在分析数据时存在“断章取义”的问题,即主观地忽略了数据的整体性而仅描述局部的变化趋势。这一问题本质上不属于“错误”,因此在编辑加工过程中比较容易被忽视,但从数据分析的严谨性上来看,同样是内容与形式不统一的表现。图2为随海拔高度呈现不同变化趋势的3组植物解剖组织厚度数据,作者原文描述为“随着海拔的增加,角质层总体上呈波动性减小趋势,在海拔4 100 m拐点处最小,为38.30 μm;上、下表皮厚度则呈波动性增加。”对照图线来看,作者对于3种不同的变化趋势描述显得笼统,仅关注了极值和始末数据点,容易造成读者忽视其中上、下表皮2条数据线之间的差异。与作者进一步分析探讨后,为客观描述3条数据线的差异,同时突出关键“拐点”(海拔4 100 m),将正文描述修改为“随海拔高度增加,角质层厚度先减小后增大,在4 100 m处最小,为38.30 μm。上、下表皮厚度在4 000 m及以下的海拔高度均随高度增加而增大;而在4 100 m及以上的海拔高度,上表皮厚度快速增大,下表皮厚度则缓慢减小。”因此,笔者建议编辑加工时应以数据为基础指导作者“先整体后局部”地描述图线趋势,即先从总体上说明图线呈现出怎样的变化规律,然后选择其中关键的数据点特别提出进行分析,兼顾整体规律性并突出关键数据点,从而给读者呈现更全面、更客观的结果。

图2 数据线变化趋势示例

1.2 形式设置的科学性

统计图在绘制过程中还涉及不同形式的选择以及坐标轴设置的问题,这从读者的角度来看是图的“形式”,但作者则需要考虑如何根据“内容”进行科学的绘制。

1.2.1 图形样式

最常用的统计图为柱形图和折线图,尽管两者均可较直观地呈现数据,但选择时需要充分考虑数据本身的性质。一般地,柱形图多用于比较不同分组数据的差异,而折线图则用于反映有内在关联数据的规律,因此在使用折线图时,需要考虑数据间是否存在“内在关联”,如时间进程、浓度梯度、温度梯度等。笔者曾在编辑工作中遇到过一个典型的案例:作者呈现的数据内容为一种药用植物中不同化学元素含量的变异系数,原始稿中使用了折线图的形式,但这些“不同化学元素”仅属于不同分组,彼此之间并不存在内在联系,故从科学性的角度考虑,应改为柱形图的样式更合理。

1.2.2 坐标设置

统计图的坐标轴决定了图中数据呈现的框架,因此在设置坐标轴时也应注意根据内容进行细节上的规划。除了基本的数值刻度、量及单位等规范性标注问题外,在遇到特殊情况时要相应地进行调整。以下列举两类比较常见的特殊情况:①当同一图中需要呈现的不同分组数值跨度较大时,建议采用分段式纵坐标,从而保证既能较平衡地呈现完整的数据,又能不因坐标数值范围的限定掩盖数据间的差异或变化趋势;②当同一图中需要呈现相同分组对应的不同量时,一般采用“共享横坐标,两侧分设纵坐标”的形式,这与分开绘制独立的图相比,更便于相关数据之间的对照。图3为一个综合了上述两种情况的示例,图中共涉及4组数据:3组为同一量的不同分类项,但其中ORC与另两项相比数值范围相差较大,故左侧纵坐标采用了分段式;而另一组为不同的量NET,但该数据是在与前三组同样的温度范围内测定的,因此将其设置为右侧纵坐标。由此可见,通过科学地设置坐标,同一图中既可清晰地呈现丰富的数据,也有效地节省了版面。

图3 分段式和两侧纵坐标的设置示例

1.3 差异比较的可读性

在核查过数据的准确性和形式的科学性后,对于涉及多组数据差异比较的统计图,还需要从可读性的角度进一步考虑优化方案,使图中展示的差异更易被读者观察和理解。

1.3.1 图形差异

单独从图形自身展示的情况来看,应注意尽可能增加相邻项目的区分度:①柱形图中同组内多项比较时,特别是在百分比堆积图中,邻近项的填充颜色或图案之间的差异要尽可能明显;②折线图中线条较多时,除了邻近的线条颜色或线型差异明显外,还要注意数据点图标形状也尽可能差异大一些。

1.3.2 比较分组

结合数据分析的内容,在考虑差异比较项的分组时,应尽可能采用“组内比较”的布局,因为从视觉距离上看,与组间比较相比,组内比较更容易观察差异。这里笔者选择了一个典型的案例辅以说明:图4(a)展示的为作者原始稿中的统计图,从正文数据分析的描述来看,该实验数据的目的是比较5个不同的树种各自在不同晾晒时间条件下树高生长量的差异,并不涉及不同树种之间的比较。若按照图4(a)中不同晾晒时间进行分组,各不同柱形代表不同树种,那么对于某一树种的不同晾晒时间而言则为“组间比较”,这样在视觉距离上存在间断式跳跃,不便于阅读。因此,笔者在编辑加工时,除了要求作者补充必要的误差线和差异显著性分析标注外,还建议作者将该图改为按不同树种进行分组,即将差异分析转换为组内比较,最终呈现为图4(b)的形式。值得一提的是,在表格可读性问题的研究中,也对表头的布局进行了类似的改造[5],可见这种使比较项空间上邻近的做法确实有益于提高图表的可读性。

图4 组间比较转换为组内比较的修改示例

2 实现内容与形式统一的要求

从上述分析及示例可以看出,作为科技论文中数据内容重要的呈现形式,统计图在审查过程中呈现的问题比较多样,因此在编辑加工中还有进一步完善的空间。基于这些问题思考如何从准确性、科学性、可读性几个层面进行优化,最终实现内容与形式统一,这也对科技期刊编辑提出了更高的要求,不仅需要练就扎实的编辑基本功,同时还要不断提高自身的专业水平。

2.1 对数据的观察力

编辑作为文字工作者,文字的审校及加工能力是职业基本素养。而对于科技期刊而言,基于其内容的特点,数据有着与文字并重的地位,因此作为科技期刊的编辑,对数据的观察力也是一项需要高度重视的基本功。已有文献指出,当前科技论文写作中存在着“实验数据不合理”的问题,包括数据过时、不当、遗漏或错误等不同表现[11]。其中数据的过时和不当主要依赖于编辑和审稿专家在审稿阶段从专业的角度进行判断;而数据的遗漏、错误则常常在论文的编辑加工中被发现,且在统计图中反映尤为明显。在前文叙述中提到,由于作者在写作阶段对数据的二次加工处理会增加出错的概率,但这类错误相对直接、明显,通过细心观察较容易发现。这就要求编辑在对科技论文审查和加工时认真对照图文,并对一些简单演算结果进行核实;同时需要核查数据分析是否符合统计学的一般原则和规律。可以说,编辑对数据的观察力是从准确性上保证统计图内容与形式统一的关键。

2.2 对内容的理解度

科技期刊的编辑一般都有相关学科的专业背景,这对于更好地理解科技论文中的数据内容有着较大的帮助。一方面由于编辑自身从事过相关的科研工作,熟悉数据来源和分析方法,所以比较容易发现其中存在的问题;另一方面,编辑自身有过阅读或直接参与写作相关科技论文的经历,则更清楚某类数据的常用呈现方式。因此,相对于文字的审校和加工而言,数据内容的审查和加工对编辑的专业基础提出了更高的要求。从前文叙述中可以看出,在图线趋势的描述、图形样式的选择以及比较分组的设置上,都涉及对于数据内容本质的理解,即编辑需要先明确作者想要展示的数据类型和得出的结论观点,再衡量图表的呈现和内容的表述是否科学合理,进而才能做出相应的修改。由此可见,编辑对内容的理解度是从科学性上实现统计图内容与形式统一的基础。

2.3 对细节的敏感性

编辑加工过程还有一个重要的作用就是对论文的润色修饰,从而使最终的作品以更完善的面貌呈现在读者面前。在科技论文中,统计图是数据内容最直观的展现形式,而这种形式的完善性往往体现在细节之处,因此要求科技期刊编辑在加工统计图时对细节有较强的敏感性。在保证数据准确、科学的基础上,通过进一步在形式细节上推敲和优化,有利于提高统计图的可读性,如前文中坐标轴的分段、图形的区分度等。虽然这些细节的处理并不影响数据内容的表达,但是经过优化后给予读者良好的阅读体验,有助于提高数据的被理解程度,也让读者可以更高效地获取统计图中的信息。这正是科技论文中使用统计图来呈现数据内容的目的。因此,编辑对细节的敏感性是从可读性上实现统计图内容与形式统一的保障。

3 结束语

科技论文中的统计图是简明地呈现数据内容的一种重要形式,因此对其进行审读与加工的过程也对科技期刊编辑提出了更高标准、更专业化的要求。为保证其内容与形式的统一,首先要遵循“纠正错误”的原则对数据分析的准确性进行认真的审查,其次要按照“合理呈现”的规范对形式设置的科学性进行专业的推敲,再者要注重“方便阅读”的意识对差异比较的可读性进行细致的优化。通过从作者、编辑、读者三方的角度全面考量,增强内容与形式的匹配度,实现两者的高度统一,最终整体呈现出较完善的作品。

[1] 熊英,欧阳贱华,於秀芝,等.科技论文中图表的加工和校对[J].编辑学报,2011,23(2):123-125.

[2] 李少闻,雷晓梅,杨媛媛,等.医学科技论文中统计图表的编辑加工技巧[J].技术与创新管理,2015,36(6): 652-653;672.

[3] 卢庆霞.编辑加工表格时应重视内容的科学性[J].编辑学报,2010,22(4):314-315.

[4] 王小辰.蔡斐.材料类科技论文表格设计常见错误剖析[J].编辑学报,2017,29(1):39-40.

[5] 李学军.科技论文表格应注意可读性:表格改造2例[J].编辑学报,2015,27(6):547-548.

[6] 宋玉梅.兼顾简约性和表现力的科技论文表格编修[J].科技与出版,2013(5):52-55.

[7] 王丽恩,王继红,邓群.学术期刊中5种不规范、不自明表格的实证研究[J].科技与出版,2015(2):58-61.

[8] 王音.农业和生物学期刊应重视对表格中数据统计分析结果的审校[J].编辑学报,2010,22(5):413-415.

[9] 郝拉娣,何平.图表中平均数差异显著性检验结果的规范表达[J].编辑学报,2008,20(2):120-121.

[10] 魏中青.编辑加工时应注意文章的数据统计:以《生态学杂志》为例[J].农业图书情报学刊,2015,27(3): 162-164.

[11] 曾群.科技论文写作中的常见问题分析[J].科技与出版,2017(10):54-57.

“福建省品牌刊社培育计划”种子期刊

曾礼娜,E-mail: jxmu3@xmu.edu.cn

猜你喜欢
可读性统计图表格
可读性
《现代临床医学》来稿表格要求
各式各样的复式条形统计图
网络健康信息可读性评估研究现状及展望*
统计表格的要求
履历表格这样填
报纸专副刊可读性探究——以湖北日报《档案解密》为例
如何选择统计图
与统计图有关的判断和说理问题
在增强地方时政新闻可读性上用足心思