为准确编辑生物信息学稿件,对目前科技期刊生物信息学稿件中最常见的一些既有关联又有区别的名词用法错误进行了辨析。结果表明:生物信息学稿件中常见的基因、蛋白质、核苷酸序列、氨基酸序列、同源性、亲缘关系等名词的使用及其表述经常有误甚至有歧义;同时对基因和蛋白质的符号表达错误进行了辨析,虽然有90%的科技期刊中基因符号已用斜体字母表达,但其中还是有很多基因符号尤其以基因命名的引物名称以及重组质粒中的基因符号未能用斜体字母表达。该研究结果可为科技期刊编辑掌握生物信息学稿件中最基本的一些名词的使用及其表述提供参考。
关键词:科技期刊,生物信息学,基因,蛋白质
中图分类号:R318.04;N04;G255.2文献标识码:ADOI:10.3969/j.issn.1673-8578.2018.01.012
Abstract:In order to edit the bioinformatics manuscripts accurately, we analyzed errors in application of the nouns both different and related in bioinformatics used in scientific journals. Our results showed that there were many errors even ambiguity in description of the basic terms in bioinformatics articles in scientific journals, including gene, protein, nucleotide sequence, amino acid sequence, homology, and phylogenetic relationship. Also, analysis of incorrect expression of some gene and protein symbols revealed that some gene symbols were not expressed by an italic type, especially the primers named with the gene or the recombinant plasmids, although the gene symbols had been expressed in italics in 90% scientific journals to show the differences between gene and protein. The findings can provide reference for journal editors to understand of the meaning and correct expression of some basic terms in biotechnological articles.
Keywords: science and technology journal, bioinformatics,gene,protein
引言
生物信息學是近年来发展起来的一门新兴学科,科技期刊中有关生物信息学方面的文章越来越多,但科技期刊的很多编辑对生物信息学方面的知识了解有限,在尚无规范和标准可参考的情况下,只能原稿来什么样就发什么样,经常会出现一些关联名词描述方面的错误,因此,对生物信息学中一些关联名词用法进行研究具有重要的意义。目前,在生物信息学编辑方面仅见蒋元霖[1]、刘华[2]、张翠英[3]、张冰[4]等关于科技期刊中基因及蛋白质符号的规范表达,宋亚珍等[5]关于同源性、一致性、相似性概念辨析等研究,有关生物信息学中更多名词的用法及其准确表述的研究尚未见报道。而科技期刊中有关基因的克隆与表达以及蛋白质的提取、分离、纯化和功能等方面研究的文章越来越多,笔者根据对此类文章的编辑实践以及对部分科技期刊此类文章的阅读,发现一些既有关联又有区别的名词,如基因与蛋白质,核苷酸序列与氨基酸序列,同源性与亲缘关系等的使用及其表述不少有误甚至存在歧义,为此,本研究对这些高使用频率关联名词的用法错误进行了分析,旨在为同人提供参考。
一基因和蛋白质名词用法错误辨析
基因和蛋白质是最常见的两个名词,虽然是两个不同的概念,但又紧密关联。基因是一段有遗传效应的脱氧核糖核苷酸序列(DNA),基因的基本结构单位是脱氧核苷酸;DNA要通过RNA的转录(mRNA)和翻译(tRNA)才能产生蛋白质,即基因编码蛋白质,蛋白质的基本结构单位是氨基酸[6-8]。生物信息学稿件中常见的错误有:
1.基因与蛋白质混淆
例1. 本研究通过 PCR技术对RcTIR1基因进行了克隆,生物信息学分析显示其含有富含亮氨酸重复序列的结构域,并通过多序列比对显示该基因与小立碗藓的生长素受体蛋白TIR1相似度达76%,初步认为该基因为生长素受体蛋白TIR1。
例1中,存在多个错误:(1)“其含有富含亮氨酸”中的“其”指基因,而基因是不含有氨基酸的,应将“其”改为蛋白质;(2)“多序列比对显示该基因”中的“该基因”是不能与蛋白质直接比较的,应将“该基因”改为蛋白质;(3)“相似度76%”指的是氨基酸序列之间的同源性比对,数值结果应描述为一致性,应将“相似度76%”改为“一致性76%”;(4)“初步认为该基因为生长素受体蛋白TIR1”有逻辑错误,即“基因”是“蛋白质”。 因此,本例应改为:“本研究通过 PCR技术对RcTIR1基因进行了克隆,生物信息学分析显示该基因编码的蛋白质含有富含亮氨酸重复序列的结构域,并通过多序列比对显示该基因编码的蛋白质与小立碗藓的生长素受体蛋白TIR1一致性达76%,初步认为该基因编码的蛋白质为生长素受体蛋白TIR1。”endprint
2.标题或图题中基因、蛋白质的描述与研究内容不一致
例2. Fesod 的生物信息学分析;Fesod生物信息学分析
例3. Actin系统进化树分析;Actin系统进化树分析
例2、例3均为常见的二级标题或图题,其中每个例子的第一句