也谈科技期刊中几种常见分子生物学名词符号的规范编排

2018-03-03 05:51周桂莲许育彬席美丽华千勇
天津科技 2018年2期
关键词:正体斜体字母

周桂莲,许育彬,席美丽,华千勇

(西北农林科技大学《麦类作物学报》编辑部 陕西杨凌712100)

大多数生物学、农学和医学期刊都会刊登分子生物学论文。这类论文中常常涉及到基因、基因在染色体上的位点以及引物、分子标记等内容。尽管这些内容早已不是什么新鲜事物,但在许多期刊发表的这类论文中,基因、位点、引物、分子标记、引物序列等符号的编排格式至今仍然五花八门;而且因为无据可依,致使许多编辑人员无所适从。虽然已经有人撰文探讨过基因、蛋白质、内切酶、病毒和质粒的正斜体编排问题[1-5],但论述都比较简短,且都未涉及基因位点、引物、分子标记等符号以及基因芯片型号、引物的核苷酸序列、基因符号中阿拉伯数字的规范编排问题,有些文章还给出了一些含糊甚至错误的信息,比如有文章称:“按照《TIG 遗传命名指南》[6],人类基因的符号由斜体大写的拉丁字母与正体的阿拉伯数字组成。”这其中“正体的阿拉伯数字”就是个错误信息,《TIG遗传命名指南》中并没有这样的信息。因此,本文统计分析了国内外 130种生物学期刊关于这些符号的编排格式,提出了这些符号的规范使用建议。

1 国内外科技期刊中几种常见分子生物学名词符号的现行编排格式

1.1 问题调查与数据统计方法

在中国知网《期刊全文数据库》中选取80种近几年刊登分子生物学论文较多的学术性中文科技期刊,其中,生物学期刊20种,农学期刊30种,医学期刊30种;在美国《科学引文数据库》中选取50种近几年刊登分子生物学论文较多的英文科技期刊,其中,生物学期刊10种,农学期刊20种,医学期刊20种。于2017年6月下旬,分别用“分子标记”“基因”“位点”“引物序列”“基因芯片”(或其相应的英文)为关键词逐刊检索其2016年以来发表的论文,每刊取不同期号发表的2~4篇文章,统计其中基因、基因位点、引物、分子标记符号以及SNP基因芯片型号的编排格式,同时统计了引物序列转行时是否加有连字符的情况。

1.2 调查结果与分析

1.2.1 基因符号的现行编排格式

简单地说,基因是含特定遗传信息的核苷酸序列,是遗传信息的最小功能单位[7]。具体一点说,基因是基因组序列中与调控、转录和/或其他功能序列相关联的有确定位置的区段,对应于一个遗传单位[8]。基因的命名在不同物种间还没有统一的规则,但各物种内的基因命名已趋于遵循统一的规则,具体可参见有关文献[6-12]。比如细菌的基因符号由3个小写斜体字母组成,具有相同表型的不同基因座(locus,如今一般被翻译为基因位点)突变用斜体大写字母后缀相区别,等位基因用紧随基因座名称后的一系列特定的数字来表示[6],如araA2表示ara基因座A的2位突变。因为每一个物种都有一个国际性的基因命名委员会,已经注册的基因都已被命名,并且经过了有关委员会的审批[6-10],作者在撰写论文时,一般都会自觉采用已有的名称;在命名新发现的基因时,一般也都会遵循本物种的基因命名规则。因此,绝大多数学术期刊中出现的问题都不是基因名称是否正确,而是基因符号的编排格式不规范。最普遍的问题是基因符号的正斜体格式不规范。在《TIG遗传命名指南》[6]中,所有基因符号中的字母都被要求为斜体,包括表示复等位基因的上角标字母(如豌豆crtys)在内;数字的正斜体虽然没有明确要求,但所有举例中,无论是阿拉伯数字还是罗马数字,也不管它们在基因符号的末尾、中间,还是上标位置,一律都是斜体(例如细菌基因lacA1,lac-23;枯草芽孢杆菌突变体基因spo0A,spoⅡB;斑马鱼基因cyctf219),未见一处例外。而从表1可知,在笔者调查的80种国内学术期刊中,基因符号有多种编排格式,其中,所有字母和数字均为斜体的期刊只占36.25%,字母为斜体、数字为正体的期刊占31.25%,还有少量期刊是部分字母为斜体、部分字母(比如代表基因座的大写字母)和数字为正体(比如将大肠杆菌aroG 基因写成aroG);最不应该发生的情况是,在不同文章,尤其是不同期号的不同文章中,格式不统一,在这一篇文章中是字母和数字均为斜体,在另一篇文章中是字母斜体、数字正体,这样的期刊还不少,占到了总数的13.75%。这正是没有统一标准造成的不良后果。

国外 SCI收录期刊的格式统一度要高得多。在所调查的 50种期刊中,基因名称和基因符号的字母和数字均为斜体的期刊占 90.00%;字母为斜体、数字为正体的期刊占 10.00%,多为亚非拉国家主办的期刊;没有字母和数字均为正体的期刊。

1.2.2 基因位点符号的现行编排格式

基因在染色体上占有的特定位置叫基因位点,又称为遗传基因座[13]。一个基因位点上往往存在两个或两个以上的基因,这些基因被称为等位基因或复等位基因[14]。基因位点符号一般也都由字母和阿拉伯数字组成,有时也会有连字符。在《TIG遗传命名指南》[6]中,基因位点(locus)被翻译为基因座,一般是在基因符号后加上适当的后缀来表示;基因位点符号中的字母和数字也都为斜体,如 1B染色体上控制小麦株高的位点符号为 Rht-B1。国内学术期刊在基因位点符号的编排格式上更为混乱(见表 1),在笔者调查的 80种期刊中,字母和数字均为正体的期刊比例最大(32.50%);字母和数字均为斜体的期刊次之(27.50%);字母为斜体、数字为正体的期刊也占有不小的比例(21.25%);在不同文章中格式不统一的期刊占 18.75%,其中个别期刊在同一篇文章中前后的格式都不一致,有的是字母和数字均为正体,有的是字母斜体、数字正体。

国外 SCI收录期刊的格式也不够统一,但与基因符号的情况相似,仍然以字母和数字均为斜体者占绝大多数(82.00%);字母为斜体、数字为正体的期刊只占 10.00%;不同文章中格式不统一的期刊占8.00%。后两类多为亚非拉国家主办的期刊。

1.2.3 引物和分子标记符号的现行编排格式

引物(primer)是人工合成的、作为 DNA 复制起始点的两段寡核苷酸序列[15]。分子标记(molecular markers)有广义和狭义之分。广义的分子标记是指可遗传并可检测的 DNA序列或蛋白质,狭义的分子标记是指 DNA标记,也就是能反映生物个体或种群间基因组中某种差异的特异性DNA片段[16]。

引物和分子标记的符号一般也都由字母和数字组成,应该用正体还是斜体,也没有统一规定,国内学术期刊在其编排格式上也不够统一(见表 1)。在笔者调查的 80种中文期刊中,引物符号中的字母和数字均为正体的期刊占 70.00%,字母和数字均为斜体的期刊占 8.75%,在不同文章中正斜体格式不统一的期刊占 21.25%;分子标记符号中的字母和数字均为正体的期刊占48.75%,字母和数字均为斜体的期刊占16.25%,字母为斜体、数字为正体的期刊占 7.50%,在不同文章中或者同一篇文章的正文与图表中正斜体格式不统一的期刊占27.50%。

SCI收录的国外期刊中,引物符号的格式比较统一,字母和数字均为正体的期刊占86.00%,均为斜体的期刊占12.00%;不同文章中格式不统一的期刊只占2.00%;分子标记符号的格式也比较统一,字母和数字均为正体的期刊占 82.00%,均为斜体的期刊占12.00%;不同文章中格式不统一的期刊占6.00%。

表1 国内外科技期刊所发表的分子生物学论文中几种常见名词符号的编排格式Tab.1 Formatting of normal nouns and symbols for molecular biology papers published in domestic or overseas sci-tech journals

需要特别说明的是,有一类 SSR(Simple sequence repeats)标记,比如检测小麦抗病基因的 SSR标记 Xcfd81、Xwmc154、Xgwm429等等,其符号开头的 X代表基因位点,所以这类标记符号一般都被排为斜体,这是应该的。同一种期刊的不同论文或同一篇论文中,这类标记被排为斜体,其他标记(如SCAR标记 SCAR203)被排为正体,笔者在调查统计时,未将其视为“格式不统一”。

1.2.4 引物序列的现行编排格式

引物序列(Primer sequences)即引物的核苷酸序列,也就是 DNA或 RNA中碱基的排列顺序,如 5'-GTGATGAAGTCGGAGTGGCA-3',其中的 A、T、G、C代表4种碱基。有些引物比较长,含有四五十个碱基,排版时往往需要转行,转行时,不宜在碱基之间加连字符,因为一个连字符代表一个省略的碱基,转行时所加的连字符容易被误认为省略了一个碱基。

国内中文期刊中,引物序列符号转行时不加连字符的期刊占 57.50%,转行时加连字符的期刊占42.50%。SCI收录的国外期刊中,引物序列符号转行时不加连字符的占 92.00%,转行时加连字符的占8.00%,后者基本为亚洲和非洲期刊。

1.2.5 SNP基因芯片型号的现行编排格式

基因芯片又称DNA 芯片(DNA chip)、DNA 微阵列(DNA microarray)、DNA 微阵列芯片(DNA microarray chip),是以预先设计的方式将大量的生物讯息密码(寡核苷酸、cDNA、基因组DNA 等)固定在玻片、硅片、聚丙烯膜、尼龙膜等固相载体上组成的密集分子阵列[17]。其中的SNP(Single Nucleotide Polymorphisms,单核苷酸多态性)基因芯片有90K、60K等不同型号。SCI收录的国外期刊中,这种K为大写者占96.00%,为小写者仅占4.00%,并且与数字之间均无空格。但国内中文期刊中,这种K有大写、小写、与数字之间留空格和不留空格4种格式,如90K、90,K、90k、90,k,有时同一篇论文中出现4种或3种格式:K为大写、与数字之间无空格的期刊占38.75%;K为小写、与数字之间有空格或无空格的期刊占17.50%;在不同文章或同一篇文章中格式不统一的期刊占31.25%。

2 上述符号的规范编排建议

没有统一的国家标准,可能是造成我国众多科技期刊分子生物学名词符号编排不规范的主要原因。因此,中国科技期刊编辑学会应该尽快牵头制定与上述分子生物学符号编排格式有关的国家标准,让相关期刊有据可依。在标准制定中,应以《TIG遗传命名指南》为基准,以方便期刊排版操作为原则,以多数国际性期刊的习惯格式为标样。笔者在此提出几点建议,供标准制定者和有关期刊参考:①根据《TIG遗传命名指南》及90%国外期刊的惯例,建议基因和位点符号中的字母和数字都用斜体。②根据 80%以上国外期刊的惯例,建议引物和标记符号中的字母和数字都用正体。③将引物序列尽量排在同一行,必须转行时,一定不要加连字符。④根据 95%以上国外期刊的惯例,建议SNP基因芯片型号中的字母大写,字母与数字之间不留空格。■

[1]张翠英. 基因及蛋白质符号的规范编排[J]. 编辑学报,2004,16(4):262-263.

[2]郭建顺,沈晓峰,张学东. 分子生物学书刊中限制性内切酶的规范表达[J]. 编辑学报,2005,17(3):195-196.

[3]张冰. 科技期刊中基因及蛋白质的规范表达[J]. 学报编辑论丛,2007:81-83.

[4]夏元玲,高珏,周丽萍,等. 分子生物学类论文中几类常见名词的正斜体编排[J]. 编辑学报,2009,21(2):127-128.

[5]王连芬,张立方,孙勇. Taq 酶正斜体编排问题的探讨[J]. 中国科技期刊研究,2011,22(2):291-292.

[6]分子生物学进展编辑部. TIG遗传命名指南[M]. 王金发,陈中健,杨琳,等译. 北京:科学出版社,2002.

[7]Helen P. What is a Gene?[J]. Nature,2006(441):398-401.

[8]张辉,丁兰,梁前进,等. 基因组学中几个分子生物学问题的探讨[J]. 生物学通报,2009,44(3):17-19.

[9]Wain H M,Bruford E A,Lovering R C,et al. Guidelines for human gene nomenclature[J]. Genomics,2002,79(4):464-470.

[10]Wright M W,Bruford E A. Human and orthologous gene nomenclature[J]. Gene,2006(369):1-6.

[11]方福德,向若兰,杨燕丽,等. 如何命名和书写基因:最新国际人类基因命名和书写规则[J]. 中国医学科学院学报,2005,27(129):128-134.

[12]Price C A,Reardon E M. Mendel,a database of nomenclature for sequenced plant genes[J]. Nucleic Acids Reserch,2001,29(1):118-119.

[13]Robert H. 世界最新英汉双解细胞与分子生物学词典[M]. 3版. 西安:世界图书出版公司,2008:319.

[14]赵寿元,乔守怡. 现代分子生物学[M]. 2版. 北京:高等教育出版社,2008:35.

[15]刘春宇,张春玲,夏家辉. 随机引物在分子生物学研究中的应用[J]. 生物化学与生物物理进展,1996,23(6):517-520.

[16]黎裕,贾继增,王天宇. 分子标记的种类及其发展[J]. 生物技术通报,1999(4):19-22.

[17]孙兵,闫彩霞,张廷婷,等. 基因芯片技术在植物基因克隆中的应用研究进展[J]. 基因组学与应用生物学,2009,28(1):153-158.

猜你喜欢
正体斜体字母
投稿须知
投稿须知
正体与斜体的使用规则
正体与斜体的使用规则
正体与斜体的使用规则
投稿须知
缓存:从字母B到字母Z
投稿须知
字母派对
正体与斜体使用规则