从基因定义的发展看“操纵基因”的概念

认证主体:吴**(实名认证)

IP属地:湖北

下载本文档

1、从基因定义的发展看“操纵基因”的概念高露摘要:“基因”术语的诞生已经有100 年之久了,在这过去的100 年里, 基因的定义经过了许多次修正。随着遗传学的发展, 特别是分子生物学的迅猛发展,人们对基因定义的认识正在逐步深化,并指出基因的概念是发展的, 随着科学研究的深入将赋予其新的内容。因此,对于“操纵基因”这一概念的评述也出现了不同的观点。关键词:基因定义,发展,操纵基因前言:自“基因”一词诞生的这100 年中, 人们对它的认识越来越深入。虽然现在对基因概念的解释又出现了新的争论, 但这是人们在对其认识过程中的又一次升华。由于现在还处于对基因本质的探究过程中,采取的方法不同,给出的基因定义可

2、能会有所偏重。因此也造成对“操控基因”一次定义的不同观点。本文将围绕基因产生与发展的过程,从不同的角度来评述一下“操纵基因”的概念。一、经典基因概念的产生与发展1工具的基因基因最早的雏形称之为“ 遗传因子”(Genetic factor), 由孟德尔提出。孟德尔遗传学说是颗粒式遗传学说, 1909 年, 约翰森觉得应该创造一个专门名词来称呼这个“颗粒”, 这个词,应该字母不多、音节很少, 以有利于作为词干构成许多别的新词。他选定的是把德弗里斯从达尔文“pangenesis ”衍生出的“pangene”缩短而成“gene”。不过这一时期的基因, 并不代表物质实体, 而是一种抽象的符号, 是决定性

5、因的遗传学家之一, 他以一种犹豫的口气写道: “基因并不太大, 以致不能当成一个化学分子, 我们的推论只能到此止步”, “虽然如此, 我们仍然很难放弃这个可爱的假设, 就是基因之所以稳定是因为它代表着一个有机的化学实体”。可见Morgan 此时对基因的理解仍缺乏准确的物质内容, 是不彻底与含糊的。在这个阶段, 基因一直被认为是一个具有自我繁殖能力的重组(或互换) 、突变和功能的基本单位,它呈颗粒状,以线性方式排列在染色体上, 即所谓的“三位一体”的概念。当时人们只知道它在起作用, 却不知道它到底是什么。3“一个基因一个酶”学说1941 年, Beadle G. W. 和Tatum E. L.

6、等以红色链孢霉为材料, 研究基因的生理、生化功能, 证明基因通过酶起作用, 提出“一个基因一个酶”的假说, 认为生物的性状可分为许多单位性状, 每个单位性状均受一种酶影响, 而酶决定于基因。因此,归根结底基因决定表型,是一个控制生物体形状的功能单位。一个基因的缺陷导致一个基本酶的缺陷,从而产生一个生长依赖突变型。4顺反子基因是DNA 分子上一段特定的核苷酸顺序1953 年, Watson 和Crick 提出DNA 双螺旋模型, 对其分子结构、自我复制、相对稳定性、变异性以及其如何贮存和传递遗传信息等问题进行了合理解释, 明确了基因是DNA 分子中的一个片段, 这标志着分子生物学时代的来临和分子

8、。总之, 顺反子是基因的同义语, 不同之处在于它含有许多突变子和重组子, 而后两者实际上都可以是一个核苷酸对。顺反子把基因具体化为DNA 分子的一段核苷酸序列, 能储存和传递遗传信息, 是决定一条多肽链的完整功能单位, 但又是可分的, 其核苷酸可以独自发生突变。顺反子否定了“基因是突变、重组的最小单位”的概念, 标志着人类对基因的认识由不可分到可再分的第二次突破, 为基因的表达调控研究奠定了理论础。5操纵子1961 年, Jacob F. 和Monod J. 研究E. coli 乳糖代谢机制, 提出乳糖操纵子模型, 首次揭示了原核基因表达的调控, 为基因表达调控机理的深入研究奠定了基础, 同时

9、丰富了基因内涵。他们认为基因不仅是传递遗传信息的载体, 还具有调控其他基因表达活性的功能。他们将乳糖操纵子的基因分为结构基因、调节基因、操纵基因及启动基因, 认为:结构基因直接控制蛋白质合成, 是决定一条多肽链的功能单位, 在一个操纵子中往往多个结构基因呈连锁关系; 操纵基因居结构基因之前, 能同阻遏物结合, 可间接控制结构基因的表达; 启动基因又居操纵基因之前,为RNA 多聚酶结合位点, RNA多聚酶必须越过操纵基因才能对结构基因进行转录, 继而翻译成相应蛋白; (调节基因编码的可扩散性阻遏蛋白, 通过与操纵基因结合与否调控整个操纵子)。显然, 这里所提出的“操纵基因”和“启动基因”与之前提

10、出的“顺反子”的含义是相悖的, 因其不编码可在细胞内扩散的产物, 其突变拷贝无法用反式的野生拷贝进行互补,而所谓的“操纵基因”仅仅只是阻遏蛋白的结合位点,后来, 人们发现乳糖操纵子中操纵基因的跨度仅约26bp。基于此, 分子遗传学家剥夺了操纵基因和启动基因的基因冠名权, 分别代之以“操作子”( operator) 和 “启动子”( promoter) 。我认为这样的定义才是比较合理与可行的。二、近代基因概念的多元化基因是DNA 分子上实现一定遗传效应的核苷酸序列随着分子生物学和分子遗传学的不断进步, 特别是由于发展出了诸如DNA 分子克隆技术和快速准确的核苷酸序列分析法, 以及核酸分子杂交技术

11、等现代生物学实验手段, 使我们能够从分子水平上研究基因的结构与功能, 发现了断裂基因、重叠基因、可移动基因、假基因、重复基因、隐蔽基因、反转录基因、超基因和印记基因等多元概念。1. 断裂基因断裂基因, 又称不连续基因, 由编码序列和非编码序列相间排列构成, 编码序列叫外显子( exon) 、非编码序列为内含子( intron) , 因为编码序列存在于成熟的RNA 中, 翻译成蛋白质后, 可呈现出一定性状, 而非编码序列在RNA 剪接过程中被切除。1977 年, 首次提出断裂基因概念。近年研究发现, 少数细菌基因中也有内含子序列, 这为研究基因演化提供了启迪。外显子保守性要远高于内含子,由于内含

12、子突变最终不出现在mRNA 中, 不受选择压力的影响, 在基因进化中的作用可能更大, 积累了突变的内含子可能演化成新基因, 而且内含子的存在有利于不同基因外显子间的重组, 使RNA 顺式剪接和反式剪接成为可能, 更增加了真核基因组本来已经巨大的编码潜能,可见内含子的存在对生物进化可能具有重大意义。2. 重叠基因它是指两个或两个以上的结构基因共用一段DNA 序列, 即它们的核苷酸序列彼此重叠的基因。有4 种情况: (1)一个基因的密码子完全包含在另一个基因里, 如 X174 噬菌体DNA 中B基因在A基因里, E 基因在D 基因时, 但它们的密码子的编码起点不同。(2)前后基因的起始点和终止点相

13、重叠, 如在 X174 噬菌体DNA 中D 基因的终止密码子的第三个核苷酸是J基因起始密码的第一个核苷酸。(3)三层重叠基因: 在G4 病毒的单链环状DNA 分子中,共有10个基因, 其中编码K蛋白质的K基因核苷酸序列有两个位置重叠着3个基因,头一个位置是同A 基因和B 基因的序列重叠,重叠部分的5个核苷酸是TGATG, 它们分别为3个基因(K、A、B) 编码, 另一个重叠位置是同编码蛋白质A和C的基因重叠, 重叠部分是4个核苷酸ATGA。(4)双链DNA分别作模板, 按不同的方向转录出独特的mRNA , 这是在极少数病毒中才有的重叠现象。3可移动基因可移动基因又称为跳跃基因、转座因子或移动基

14、因。1956 年, 麦克林托克在研究玉米籽粒的色素斑点时, 首先提出了一个可在染色体上移动的“控制因子”, 一个控制因子整合到一个基因位点上, 可产生一种新的突变型。这些可移动的DNA 片段叫做跳跃基因。随后的大量研究发现有一百多种跳跃基因存在于细菌的基因组中, 主要包括插入序列、转座子和TnA家族。跳跃基因的发现使人们进一步认识到基因不都是稳定、静止不动的实体, 它可以通过自身的运动调节基因的活性。人类通常“纵向”获得自身基因, 细菌则不仅以这种“纵向”方式获得基因, 还能以“横向”方式从一个不相干的细菌获得基因。近来发现: 横向基因跳跃在哺乳动物和两栖动物可能也存在23, 这一发现如果得到

15、证实, 也许将改变人类对进化的理解。4假基因假基因,看似正常却不能表达任何RNA或蛋白质的基因, 包括已知功能基因的残存拷贝、散在分布的长细胞核因子(LINEs) 和散在分布的短细胞核因子(SINEs) , 后两者为哺乳动物基因组中的重复序列, 其中LINE 源于RNA聚合酶的转录产物, 是一类可自主转座的反转录转座子, 而SINE源于RNA聚合酶的转录产物,则是一类非自主转座的反转录转座子。假基因核苷酸序列与相应正常基因的同源度可达75% - 80% , 由于突变阻碍了其自身表达, 从而失去正常转录功能。1977 年, Jacq C等在研究非洲爪蟾的5S RNA 基因时, 首先发现假基因 ,

16、 后来人们陆续发现珠蛋白基因簇、免疫球蛋白基因簇、组织相容性抗原基因簇中也存在, 而且通常散布于有活性的功能基因之间。此类基因仅限于真核生物,且大部分位于染色体上正常基因的附近, 也有的位于不同的染色体上。假基因的结构特点有: 不同部位有不同程度的缺失或插入; 缺少正常基因的内含子和启动子; 5端都有真核mRNA 分子特有的AATAAA 信号, 造成转录启动区的缺陷; 两侧有顺向重复序列。可见, 假基因是正常基因转录出的mRNA 经加工以后, 再反转录成cDNA, 然后整合到染色体上的基因组中去的结果, 故又称加工基因, 基于此, 也常被视为一种非自主的反转录转座元件。但近年研究表明, 假基因

17、可以分为加工的和未加工的两类, 前者从mRNA反转录而来, 不含任何内含子结构, 而后者可能源于基因重复。2002 年, Harrison et al. 等发展了一种筛查和识别人类基因组中假基因的新方法,依据多聚腺苷化的有无以及与功能基因除去内含子后的序列连续同源度是否大于70%, 发现人类基因组最先完整测序的21和22号染色体总共有189个加工假基因, 195个未加工假基因, 还有70个假基因性的免疫球蛋白基因片段, 并据以推断整个人类基因组可能大约有近20000个假基因, 其中一半以上为加工假基因。他们还发现在这两条染色体的着丝点附近有显著冗余的相关基因的假基因, 提示人类基因组中假基因热

18、点的存在; 而加工假基因群分布则相当均匀, 其中22号染色体假基因群以免疫球蛋白基因片段为主。先前, 人们认为假基因无生物学功能, 不受进化的选择压力, 可积累突变, 常常同时存在三种终止码序列, 由于缺乏选择压力, 它可能会由于随机突变的积累而变得面目全非, 因而被视为垃圾。但近来科学家们认识到,这对假基因有失公平。因为实验中观察不到其编码产物并不能证明它在生物体内从未编码功能产物, 而且不编码功能产物也并不能排除其可能拥有的其它功能; 同时,排除仅仅基于序列信息的蛋白表达也是不客观的,因为DNA 信息可被RNA 编辑所改变。2000年,又提出了功能假基因的新概念,对传统假基因无功能概念提出

19、挑战。假基因由功能基因演变而来, 其存在本身就是其功能活性的明证, 若是无用的, 自然选择早已将其淘汰,因为细胞合成DNA 的能量代价极其昂贵。5. 重复基因重复基因, 指在真核基因组中具有一份以上拷贝的基因, 这些拷贝或在一条染色体上串联排列, 或分散到多条染色体上, 包括寡拷贝基因和多拷贝基因, 前者有人的珠蛋白基因、癌基因及某些假基因,后者包括组蛋白基因、rRNA基因等, 其结构基础分别是DNA 的低度重复序列和中度重复序列。重复基因的存在可增加基因剂量, 提高基因表达效率, 而且不同时空表达的具有一定结构差异的产物可以满足生物个体发育不同时期的需要。6隐蔽基因一般来说, 用做翻译模板的

20、mRNA 分子应该与其编码基因有对应关系。也就是说它的核苷酸碱基与基因的核苷酸碱基互补, 而且数量相等。对真核基因来说应与外显子序列相对应。但是, 自1985 年以来, 在某些病毒、植物和动物中发现, mRNA 前体在成熟过程中发生了碱基的增加、缺失或替换, mRNA与某因之间失去了一一对应关系。这一现象首先在原生动物锥虫中发现, 并称之为RNA编辑。这种需要编辑才能正常表达的基因称为隐蔽基因(cryptogene) 。隐蔽基因的发现使对基因的准确定义更加困难。7反转子及反转录基因第一个反转录基因是1987 年由病毒.学家 Dhundale 等在一种古老的细菌Myx ococcusx anth

21、us 中通过一种叫msDNA 的新型卫星DNA而发现的一个非常重要的原始反转录因子一retron(msDNA)。retron 是一群古老的以反转录作用合成RNA/ mDNA 复合msDNA 分子的遗传单元,我们暂称它为反转子。以后的研究证明,msDNA广泛存在于Myx obacter 细菌类的许多属和种中, 它由细菌基因组上一段叫retron 的DNA 序列经转录和反转录产生, 我们称之为反转录基因。除Myx obacter 群的细菌细胞以外, 近几年在大肠杆菌中发现了六个retron,在真核生物基因组中发现了类似retron的反转录单元copia, gypsy 和LINE等。细菌染色体上的r

22、etron基因组由5端的非转录区msr,反转录区msd和3端的反转录酶( reverse transcripiase简称RT ) 基因等三部分组成。8超基因超基因, 指在真核生物中, 作用于一种或一系列性状的几个紧密连锁的基因, 类似于原核生物中的操纵子, 如人类的血红蛋白基因簇。功能相同或相关的许多基因聚集而成基因簇, 可以是基因重复产生的两个相邻的相关基因, 也可以是许多个相同的基因首尾衔接的串联排列, 如组蛋白基因和rRNA基因, 其中也可以有假基因。一个祖先基因经过重复和变异而产生的一组基因称基因家族, 结构基因家族中各成员通常具有相关甚或相同的功能。共同的祖先基因通过各种变异产生的结

23、构大致相同, 而功能不尽相似的一大批基因, 虽属不同基因家族, 可总称为一个超家族。在成簇的基因家族中, 通过染色体重排而分散到其他位置上的成员, 称为孤儿基因。9印记基因印记基因, 指功能受到双亲基因组的影响而被打上雌雄亲本特异标记的基因,为哺乳动物的基因组特有, 实质是双亲相应基因的甲基化程度不同。印记产生于生殖细胞发育期, 恒定于胚胎发育期, 消除于性腺形成期并同时产生自身新的印记。在胚胎和成体的二倍体体细胞中, 源于父本或母本的等位基因有选择性表达特征。印记基因表现为单亲依赖性遗传, 无论遗传物质来自双亲中的哪一方, 均具相同的表型效应, 等位基因不会因为位于不同亲代来源的染色体上而产

24、生不同的效应,这与孟德尔遗传规律相悖, 似乎能作为不同亲源等位基因的可识别标记, 故称。印记基因的概念萌生于杂交双亲遗传效应的不同, 最早可追溯到数世纪前, 伊拉克人发现驴和马正反交, 其子代有驴骡和马骡的差异。但直到20 世纪50 年代末, 才首次发现果蝇白眼基因座的一些等位基因在子代中的不同表达, 取决于该等位基因是来源于父本还是母本;80 年代中期, 科学家研究小鼠胚胎发育时发现雌雄个体的基因组对胚胎发育的作用有差异; 1991 年,第一个印记基因IGF2在小鼠基因组中被发现。印记基因主要有以下特点: 印记基因遍布于整个基因组中, 人类基因组中约有100个印记基因;有些印记基因聚集成簇,

25、 形成染色体印记区; 尽管有些印记基因紧密连锁, 但却表现出不同的印记效应。如: 小鼠7 号染色体远端的IGF2基因和H19基因连锁, 但IGF2 是母亲印记失活基因, H19则是父亲印记失活基因;印记基因的内含子一般均较小,内含子/ 外显子长度之比也较小, 雄性印记基因的重组率高于雌性印记基因;表达具有组织特异性。据此研究者认为,基因是一个化学实体,实质上是DNA 分子中具有遗传效应的一段特定的核苷酸序列。而所谓的“遗传效应”就是对蛋白质合成有直接或间接影响的部分,有遗传效应的DNA片段就是能够直接指导或间接调控蛋白质合成的碱基序列。那么从这个角度来看,调控单元中“操纵基因”的概念是具有一定

26、的合理性的,因为虽然它只是一个蛋白结合位点,并不编码产物,但是却能够影响临近基因的表达从而间接调控蛋白质的合成。三、基因组计划后基因概念的发展20 世纪70 年代, DNA克隆和测序技术发展并逐步成熟, 噬菌体MS2成为第一个基因测序和完成全基因组测序的生物, 以后又有很多生物完成了全基因组测序。于是人们开始研发进行基因注释的计算机运算法则, 这些运算法则对基因的注解主要是基于其序列的特点, 尤其基因全部编码区或称“开放阅读框(Open reading frame, ORF)的特点。这时很多基因指的是一些特殊的DNA序列, 因为他们和已经注解的基因序列相似, 后者则是20 世纪50 年代到70

27、年代揭示的一些DNA功能。这些注解基因被称为“名义的基因”。在一定意义上, 这时的基因其实是基因组中注解的ORF。现在对基因的注解也主要基于其序列特点, 如国际人类基因组组织(HUGO)将基因解释为“可以影响基因型或功能的DNA片段”。 从这个角度看来,操控基因的确是特殊的片段,通过调控间接影响着基因型的产生,多少也符合基因的意义了四、ENCODE 计划后基因概念的发展ENCODE 计划的最新一批研究成果, 使关于人类基因的传统理论受到挑战, 首先, 人类基因蓝图不是由孤立的基因和大量“垃圾DNA 片段”组成的,所谓的垃圾基因实际上非常少, 蛋白编码基因只不过是众多具有特定功能的DNA序列元件的一种。单个基因、调控元件以及与编码蛋白无关的其他类型的DNA 序列一道, 以交叠的方式相互作用, 形成一个复杂的网络系统, 共同控制着人类的生理活动。其次, ENCODE 计划发现了更为普遍的非编码RNA(ncRNAs)。人类基因组中有93%的DNA 都会转录成RNA, 众多转录本为非编码RNA, 这些转录本可以发生相作用。还有, ENCODE 计划发现了更为复杂的选择性剪接。单个基因可以产生一个以上的蛋白质。在选择性剪接过程中, 一个细胞可以选择不同

0/150

联系客服

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。人人文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知人人文库网,我们立即给予删除!

THE END
0.遗传学定义.doc内含子introns 定义:断裂基因中外显子的间插序列,可参与前提RNA的转录,但其转录的RNA序列于转录后的加工中被切除,不包括于成熟的RNA分子中。 体外,离体in vitro 定义:在活的生物体外。 知识产权intellectual property right 定义:专利,版权和商标。 K 染色体组型karyotype 定义:一组以标准模式排列的染色体显微摄影jvzquC41o0hpqt63:0ipo8mvon532:<124631A<;969:47xjvo