崔黎明,邵碧云,曹智勇,徐 敏
(上海交通大学医学院学报编辑部,上海200025)
遗传学家将基因定义为具有遗传效应的DNA片段,因此DNA成为遗传信息的主要载体。根据遗传学中心法则的观点,遗传信息从DNA转录为RNA,再从RNA翻译为蛋白质。人类疾病都直接或间接地与基因有关。随着基因重组技术和测序技术的发展,许多新的疾病相关基因陆续被发现。对这些基因的表达调控和功能表型的研究极大地完善了人们对疾病本质的认识,也产生了大量与此相关的科研成果。
《上海交通大学学报(医学版)》是一本医学学术期刊,经常会收到涉及基因相关研究的稿件,如《临床上利用基因诊断的方法对某遗传病进行诊断》《分析某基因或者蛋白质在临床病理标本中的表达水平并探索其表达与预后的关系》《构建某基因或者蛋白质表达上调/下调的实验模型》《探究该基因或者蛋白质表达失调对疾病发生发展的影响》等等。这类稿件中同一个外文缩写在不同的语境下表示了不同的含义。以肿瘤研究中最受关注的基因Tumor Protein P53为例,它的基因符号是TP53,一般在介绍该基因的发现、染色体定位或者基因结构时,以斜体表示;如果描述该基因编码的蛋白质在肿瘤中的调节功能时,不用斜体,应表示为TP53。因此,医学编辑在对稿件进行编辑加工的时候,需要特别注意基因符号所在的语境,确保在相应的语境下,使用正确的书写方式。
国际权威杂志《遗传学进展》(Trends in Genetics)编辑部编辑出版了一本《TIG遗传命名指南》(TIG Genetic nomenclature guide),其中总结了包含18种生物(植物、人类、脊椎动物、无脊椎动物、酵母、丝状真菌、原生动物及细菌等)的基因与等位基因、基因型、表型及蛋白质产物和突变体符号[1]。总的来讲,表示基因、等位基因的符号排斜体;表示蛋白质、表型的符号排正体[2-3]。基因符号中字母的大小写因物种的不同而有所不同[4]。灵长类(包括人类)、家禽或家畜基因符号的所有字母大写,而小鼠或大鼠基因符号仅首字母大写,其余字母小写。
论文中一般在基因首次出现时,使用基因全名。基因的全名不用斜体,也不用希腊字母,如insulin-like growth factor 1(胰岛素样生长因子1)。除了首次出现显示基因全名,文中其他位置均可使用基因符号,即基因全名的缩写。基因符号使用斜体,第一个字母大写,其余小写,不用希腊字母和连字符,如Igf1(胰岛素样生长因子1)。蛋白质的缩写名称和基因相同,但不用斜体,并全部大写,如IGF1。
同小鼠和大鼠一样,完整的基因名称不用斜体和希腊字母,如insulin-like growth factor 1(胰岛素样生长因子1)。基因缩写名称也使用斜体,但所有的字母用大写(这点与小鼠/大鼠不同),不使用希腊字母和连字符,如IGF1。蛋白质的缩写名称也与基因相同,但不用斜体,并全部大写,如IGF1。
根据《TIG遗传命名指南》,如果表示基因或者蛋白质的外文缩写紧邻“基因” “蛋白质”字样,其写法基本不会发生混淆。但在科研论文中,表示基因或者蛋白质的外文缩写往往单独出现,相邻位置或者整个句子中没有“基因” “蛋白质”字样,这时判断该缩写应是斜体还是正体,就有一定的难度。一般需要结合具体的语境和上下文的含义,先判断该处表示的是DNA、RNA还是蛋白质,再根据《TIG遗传命名指南》,采用正确的写法。
我们知道基因是DNA分子上具有遗传信息的特定核苷酸序列的总称,是具有遗传效应的DNA分子片段。信使RNA(mRNA)由DNA转录而来,携带遗传信息。cDNA是利用逆转录酶以RNA(通常是mRNA)为模板合成的复制品。因此,在介绍DNA、mRNA、cDNA时一般都表示的是基因,需要使用斜体。
具体来说,在介绍基因的发现、染色体定位、含有的碱基数、基因结构(内含子、外显子等)、基因上的调控元件(启动子、增强子等)、基因的碱基突变(移码突变、错义突变、无义突变、点突变等)和染色体变异时,一般都使用斜体。此外,DNA片段及等位基因也采用斜体书写。例如,“与NOTCH23’UTR的结合区域” “MAPK1位于22号染色体” “BCL2的启动子序列”。
上述提到的mRNA,充当了蛋白质合成时的模板。但除了mRNA,还有一些RNA是不能翻译成蛋白质的。这类RNA被称为非编码RNA(non-coding RNA),包括rRNA、tRNA、snRNA、snoRNA 和microRNA等多种已知功能的RNA,也包括未知功能的RNA。由于这些非编码RNA相当于基因的中间产物,也作为一种表达产物,在书写的时候,使用正体,不使用斜体。例如,“miR-142是T细胞的特异性miRNA” “LncRNA H19 在癌组织中的表达显著高于癌旁组织”“丙氨酸tRNA只携带丙氨酸”“U3 snRNA与核仁内28S rRNA的成熟有关”。
不难发现,以上例子主要体现了非编码RNA作为表达产物的功能。但当从基因层面介绍非编码RNA时,还是需要将其当做基因,在书写的时候,使用斜体。例如,“LncRNAH19作为第一个印记基因被发现”“过表达lncRNAHOTAIR”。
蛋白质是基因转录翻译后的最终产物,是构成组织和细胞的重要成分,作为生命活动中最基本的和最重要的物质基础,发挥着重要的作用。医学科技类期刊的稿件中,经常会提到配体、受体、激素、酶(磷酸酶、激酶等)、转录因子、信号通路分子等,这些都是从功能的角度来介绍的,因此尽管没有出现“蛋白质”字样,也可以根据语意,判断其表示的是蛋白质,在书写时应使用正体。例如,“阻断JAK2/STAT3通路的活化,降低VEGF和bFGF的mRNA和蛋白的表达水平” “Flt3属II类受体酪氨酸激酶家族,又称FLK2” “SLC25A10与细胞内的能量代谢以及mTOR信号通路密切相关”。
另外,在期刊中也会经常遇到“基因型”和“表型”的字样。基因型是从遗传角度讲的,因此,关于基因型的写法,是采用相应的基因符号,用斜体表示,且首字母大写;而表型是从性状的角度讲的,是基因型和环境共同作用的结果,所以关于表型的写法,用正体表示。表型根据是否是先天获得的,分成野生型和突变型。其中,野生型在名称后面加上“+”,突变型在名称后面加上“-”。例如,“念珠菌野生型表型Icg+” “念珠菌突变型表型Icg-”(参见http://www.candidagenome.org/Nomenclature.shtml)。
基因和蛋白质名称的正斜体表达,虽然已有行业内的规范,但是在作者群体中尚未得到很好的普及。这可能有以下几种原因:①作者没有受过专业的写作规范训练,缺乏写作经验;②有些作者虽然了解《TIG遗传命名指南》,但在写作过程中不重视正斜体的规范写作;③对语境判断失误,正斜体写作混淆。
对于编辑来说,必须规范地使用基因和蛋白质的名称,以准确地反映基因或者蛋白质在论文中的特定含义,同时也相应提高期刊的编校质量。这是对编辑工作的基本要求。在编辑加工过程中,编辑有时候难以从字面对基因及其表达产物的正斜体进行判断,因此编辑在自身加强医学知识学习的同时,还应就正斜体写作规范多与作者进行沟通和探讨。对于第①类和第②类作者,编辑要起到培训的作用,向作者提出规范的写作要求,以便帮助作者在后续的投稿中加强写作规范;对于第③类作者,编辑需要多和作者进行交流和切磋。在出现分歧的时候,编辑可以列举一些较规范的期刊中存在类似语境的实例,与作者讨论,并最终达成一致。综上,期刊编辑需在编校工作中高度重视基因和蛋白质名称的正确写法,做到规范运用。如果在编辑加工时无法根据具体的语境直接对正斜体的使用作出判断,应多与作者沟通确认,明确作者的真实意图,然后根据命名规范在论文中正确呈现。
[1]《遗传学进展》编辑部.TIG遗传命名指南[M].王金发,译.北京:科学出版社,2000.
[2]张翠英.基因及蛋白质符号的规范编排[J].编辑学报,2004,16(4):262-263.
[3]张晶,李万会.外文字母正斜体在生物学类论文中的正确使用[M]//学报编辑论丛(2012).上海:上海大学出版社,2012:102-104.
[4]原丽欣.分子生物学领域几种常见名词符号的规范编排[J].中国科技期刊研究,2011,22(6):962-965.