认证主体:宁夏凯米世纪网络科技有限公司
IP属地:宁夏
统一社会信用代码/组织机构代码
91640100MA774ECW4K
下载本文档
1、从基因定义的发展看“操纵基因”的概念高露摘要:“基因”术语的诞生已经有100年之久了,在这过去的100年里,基因的 定义经过了许多次修正。随着遗传学的发展,特别是分子生物学的迅猛发展,人 们对基因定义的认识正在逐步深化,并指出基因的概念是发展的,随着科学研宄 的深入将赋予其新的内容。因此,对于“操纵基因”这一概念的评述也出现了不 同的观点。关键词:基因定义,发展,操纵基因前言:自“基因” 一词诞生的这100年中,人们对它的认识越来越深入。虽然现 在对基因概念的解释乂出现了新的争论,但这是人们在对其认识过程中的乂一 次升华。由于现在还处于对基因本质的探究过程中,采取的方法不同,给出的基因 定义可
2、能会有所偏重。因此也造成对“操控基因”一次定义的不同观点。本文将 围绕基因产生与发展的过程,从不同的角度来评述一下“操纵基因”的概念。一、经典基因概念的产生与发展1. 工具的基因基因最早的雏形称之为“遗传因子” (genetic factor),由孟徳尔提出。 孟德尔遗传学说是颗粒式遗传学说,1909年,约翰森觉得应该创造一个专门名 词来称呼这个“颗粒”,这个词,应该字母不多、咅节很少,以有利于作为词干 构成许多别的新词。他选定的是把德弗里斯从达尔文“pangenesis ”衍生出 的“pangene”缩短而成“gene”。不过这一时期的基因,并不代表物质实体,而 是一种抽象的符号,是决定性状
3、的遗传因子,还没有具体涉及基因的物质概念, 基因就像一个工具,如被孟德尔用来作为其实验统计的单位,当然这时的基因 体现的也只是一个功能单位。2. 基因的染色体理论一一 “三位一体”的概念早在1883年,w. roux就己推测细胞核内的染色体乃是遗传因子的载体, 他所能设想出来的唯一的一个可以说明他所观察到的遗传结果的模型是排列成 行并能照样复制的物体,他为了解释基因从细胞到细胞的传递机制,就认为细 胞核必定有“串珠式”的结构,它们排列成行并能自体复制,而在细胞核屮看起 来最有可能的既带基因又能满足上述要求的就是染色体。t. boveri和w. s. sutton在1902年中所做的实验为基因是
4、染色体的一部分提 供了证据。随后,w. bateson等在香豌豆杂交试验中首次发现性状连锁现象,而 对这一现象做出确切解释的却是摩尔根(t. 11. morgan)。1910年摩尔根及其协作 者们以果蝇为研究对象,把白眼隐性突变基因定位于x染色体上,第一次将代 表某一特定性状的基因同某一特定的染色体联系起来了,从而发展出了“基因是 染色体的离散单元”的理论,这一理论揭示了基因与性状之间的关系和遗传的传 递规律。他认为:“基因连接成直线,好像线上的联珠”,“种质必须由某种独 立的要素组成,正是这些要素我们叫做遗传因子,或者更简单地叫做基因”。不 仅如此,morgan还是首先从分子水平上考虑基因的
5、遗传学家之一,他以一种犹 豫的口气写道:“基因并不太大,以致不能当成一个化学分子,我们的推论只能 到此止步”,“虽然如此,我们仍然很难放弃这个可爱的假设,就是基因之所以 稳定是因为它代表着一个有机的化学实体”。可见morgan此时对基因的理解仍 缺乏准确的物质内容,是不彻底与含糊的。在这个阶段,基因一直被认为是一个 具有自我繁殖能力的重组(或互换)、突变和功能的基木单位,它呈颗粒状,以线 性方式排列在染色体上,即所谓的“三位一体”的概念。当时人们只知道它在起 作用,却不知道它到底是什么。3. “一个基因一个酶”学说1941年,beadle g. w.和tatum e. l.等以红色链孢霉为材料
6、,研究基因 的生理、生化功能,证明基因通过酶起作用,提出“一个基因一个酶”的假说,认 为生物的性状可分为许多单位性状,每个单位性状均受一种酶影响,而酶决定 于基因。因此,归根结底基因决定表型,是一个控制生物体形状的功能单位。一 个基因的缺陷导致一个基本酶的缺陷,从而产生一个生长依赖突变型。4. 顺反子一一基因是dna分子上一段特定的核苻酸顺序1953年,watson和crick提出dna双螺旋模型,对其分子结构、自我复 制、相对稳定性、变异性以及其如何贮存和传递遗传信息等问题进行了合理解释, 明确了基因是dna分子中的一个片段,这标志着分子生物学时代的来临和分子 遗传学的诞生。于是,基因结构和
8、突变子和重组子,而后两者实际上都可以 是一个核苷酸对。顺反子把基因具体化为dna分子的一段核苷酸序列,能储存和 传递遗传信息,是决定一条多肽链的完整功能单位,但又是可分的,其核苻酸 可以独自发生突变。顺反子否定了 “基因是突变、重组的最小单位”的概念,标 志着人类对基因的认识由不可分到可再分的第二次突破,为基因的表达调控研 允奠定了理论础。5. 操纵子1961年,jacob f.和monod j.研究e. col i乳糖代谢机制,提出乳糖操 纵子模型,首次揭示了原核基因表达的调控,为基因表达调控机理的深入研究 奠定了基础,同时丰富了基因内涵。他们认为基因不仅是传递遗传信息的载体, 还具有调控其
9、他基因表达活性的功能。他们将乳糖操纵子的基因分为结构基因、 调节基因、操纵基因及启动基因,认为:结构基因直接控制蛋白质合成,是决定 一条多肽链的功能单位,在一个操纵子中往往多个结构基因呈连锁关系;操纵 基因居结构基因之前,能同阻遏物结合,可间接控制结构基因的表达;启动基 因又居操纵基因之前,为rna多聚酶结合位点,rna多聚酶必须越过操纵基因冰 能对结构基因进行转录,继而翻译成相应蛋0;(调节基因编码的可扩散性阻遏 蛋白,通过与操纵基因结合与否调控整个操纵子)。显然,这里所提出的“操纵基因”和“启动基因”与之前提出的“顺反子” 的含义是相悖的,因其不编码可在细胞内扩散的产物,其突变拷贝无法用反
10、式 的野生拷贝进行互补,而所谓的“操纵基因”仅仅只是阻遏蛋白的结合位点,后 来,人们发现乳糖操纵子中操纵基因的跨度仅约26bp。基于此,分子遗传学家剥 夺了操纵基因和启动基因的基因冠名权,分别代之以“操作子”(operator)和“启动子”(promoter)。我认为这样的定义才是比较合理与可行的。二、近代基因概念的多元化一一基因是dna分子上实现一定遗传效应的核苷酸 序列随着分子生物学和分子遗传学的不断进步,特别是由于发展出了诸如dna 分子克隆技术和快速准确的核苷酸序列分析法,以及核酸分子杂交技术等现代 生物学实验手段,使我们能够从分子水平上研究基因的结构与功能,发现丫断 裂基因、重叠基因
11、、可移动基因、假基因、重复基因、隐蔽基因、反转录基因、 超基因和印记基因等多元概念。1. 断裂基因断裂基因,又称不连续基因,由编码序列和非编码序列相间排列构成,编码 序列叫外显子(exon)、非编码序列为内含子(intrcm),因为编码序列存在于 成熟的rna中,翻译成蛋白质后,可呈现出一定性状,而非编码序列在rna剪 接过程中被切除。1977年,首次提出断裂基因概念。近年研宄发现,少数细菌 基因中也有内含子序列,这为研允基因演化提供了启迪。外显子保守性要远高于 内含子,由于内含子突变最终不出现在mrna屮,不受选择压力的影响,在基因 进化中的作用可能更大,积累了突变的内含子可能演化成新基因,
12、而il内含子 的存在有利于不同基因外显子间的重组,使rna顺式剪接和反式剪接成为可能, 更增加了真核基因组本来已经巨大的编码潸能,可见内含子的存在对生物进化可 能具有重大意义。2. 重叠基因它是指两个或两个以上的结构基因共用一段dna序列,即它们的核苻酸序 列彼此重叠的基因。有4种情况:(1)一个基因的密码子完全包含在另一个基因 里,如* x174噬菌体dna中b基因在a基因里,e基因在d基因时,但它们的 密码子的编码起点不同。(2)前后基因的起始点和终止点相重叠,如在* x174 噬菌体dna屮d基因的终止密码子的第三个核苷酸是j基因起始密码的第一个核 苻酸。(3)三层重叠基因:在g4病毒的
13、单链环状dna分子中,共有10个基因,其 中编码k蛋白质的k基因核苷酸序列有两个位置重叠着3个基因,头一个位置是同a 基因和b基因的序列重叠,重叠部分的5个核苷酸是tgatg,它们分别为3个基因 (k、a、b)编码,另一个重叠位置是同编码蛋白质a和c的基因重叠,重叠部分是 4个核苻酸atga。(4)双链dna分别作模板,按不同的方句转录出独特的mrna ,这是在极少数病毒中才有的重叠现象。3. 可移动基因可移动基因又称为跳跃基因、转座因子或移动基因。1956年,麦克林托克在研宄玉米籽粒的色素斑点时,首先提出了一个可在染色体上移动的“控制因 子”,一个控制因子整合到一个基因位点上,可产生一种新的
14、突变型。这些可移 动的dna片段叫做跳跃基因。随后的大量研究发现有一百多种跳跃基因存在于细 菌的基因组中,主要包括插入序列、转座子和tna家族。跳跃基因的发现使人们 进一步认识到基因不都是稳定、静止不动的实体,它可以通过自身的运动调节基 因的活性。人类通常“纵向”获得自身基因,细菌则不仅以这种“纵向”方式获 得基因,还能以“横向”方式从一个不相干的细菌获得基因。近来发现:横向基 因跳跃在哺乳动物和两栖动物可能也存在23,这一发现如果得到证实,也许 将改变人类对进化的理解。4. 假基因假基因,看似正常却不能表达任何rna或蛋白质的基因,包括己知功能基因的残存拷w、散在分布的长细胞核因子(ltne
15、s)和散在分布的短细胞核因子 (sines),后两者为哺乳动物基因组中的重复序列,其中line源于rna聚合酶 的转录产物,是一类可自主转座的反转录转座子,而sine源于rna聚合酶的转录 产物,则是一类非自主转座的反转录转座子。假基因核苷酸序列与相应正常基因的同源度可达75%-80%,由于突变阻碍了其自身表达,从而失去正常转录功能。1977年.jacqc等在研究非洲爪蟾的5srna基因时.首先发现假基因.后 来人们陆续发现珠蛋白基因簇、免疫球蛋白基因簇、组织相容性抗原基因簇中也存在.,而且通常散布于有活性的功能基因之间。此类基因仅限于真核生物.且大部分位于染色体上正常基因的附近.也有的位于不
16、同的染色体上。假基因的结构特点有:不同部位有不同程度的缺失或插入;缺少正常基因的内含子和启动子;5'端都有真核mrna分子特奋的aataaa信号,造成转录启动区的缺陷;两侧有顺向重复序列。可见.假基因是正常基因转录出的mrna经加工以后.再反转录成cdna,然后整合到染色体上的基因组中去的结果,故乂称加工基因,基于此.也常被视为一种非自主的反转录转座元件。但近年研宄表明,假基因可以分为加工的和未加工的两类.前者从mrna反转录而来.不含任何内含子结构.而后者可能源于基因重复。2002年,harrison et cu.等发展了-种筛查和识别人类基因组中假基因的新方法,依据多聚腺苷化的有无
17、以及与功能基因除去内含子后的序列连续同源度是否大于70%,发现人类基因组最先完整测序的21和22号染色体总共有189个加工假基因,195个未加工假基因,还有70个假基因性的免疫球蛋白基因片段,并据以推断整个人类基因组可能大约有近20000个假基因.其中一半以 上为加工假基因。他们还发现在这两条染色体的着丝点附近有显著冗余的相关基因的假基因,提示人类基因组中假基因热点的存在;而加工假基因群分布则相当均匀,其屮22号染色体假基因群以免疫球蛋白基因片段为主。先前,人们认为假基因无生物学功能,不受进化的选择压力.可积累突变.常常同时存在三种终止码序列,由于缺乏选择压力,它可能会由于随机突变的积累而变得
18、面b全非,因 而被视为垃圾。但近来科学家们认识到,这对假基因有失公平。因为实验中观察不到其编码产物并不能证明它在生物体内从未编码功能产物,而且不编码功能产物也并不能排除其可能拥有的其它功能;同时.排除仅仅基于序列信息的蛋白表达也是不客观的,因为dma信息可被rna编辑所改变。2000年,又提出了功能 假基因的新概念,对传统假基因无功能概念提出挑战。假基因由功能基因演变而来,其存在本身就是其功能活性的明证.若是无用的,自然选择早已将其淘汰,因为细胞合成dna的能量代价极其昂贵。5. 重复基因重复基因,指在真核基因组中具有一份以上拷贝的基因,这些拷贝或在一 条染色体上串联排列,或分散到多条染色体上
19、,包括寡拷贝基因和多拷贝基因, 前者有人的珠蛋白基因、癌基因及某些假基因,后者包括组蛋白基因、rrna基因 等,其结构基础分别是dna的低度重复序列和中度重复序列。重复基因的存在可 增加基因剂量,提高基因表达效率,而且不同时空表达的具有一定结构差异的 产物可以满足生物个体发育不同时期的需要。6. 隐蔽基因一般来说,用做翻译模板的mrna分子应该与其编码基因有对应关系。也就 是说它的核苷酸碱基与基因的核苷酸碱基互补,而且数量相等。对真核基因来说 应与外显子序列相对应。但是,自1985年以来,在某些病毒、植物和动物屮发 现,mrna前体在成熟过程中发生了碱基的增加、缺失或替换,mrna与某因之间
20、失去了一一对应关系。这一现象首先在原生动物锥虫中发现,并称之为rna编辑。 这种需耍编辑冰能正常表达的基因称为隐蔽基因(cryptogene)。隐蔽基因的发 现使对基因的准确定义更加困难。7. 反转子及反转录基因第一个反转录基因是1987年由病毒.学家dhundale等在一种古老的细菌 myx ococcusx anthus中通过一种叫msdna的新型tl星dna而发现的一个非常重 要的原始反转录因子一retron(msdna) oretron是一群古老的以反转录作用合成 rxa/ mdna复合msdna分子的遗传单元,我们暂称它为反转子。以后的研宂证明, msdna广泛存在于myx obac
21、ter细菌类的许多属和种屮,它由细菌基因组上一段 叫retron的dna序列经转录和反转录产生,我们称之为反转录基因。除myx obacter群的细菌细胞以外,近几年在大肠杆菌中发现了六个retron,在真核生 物基因组中发现了类似retron的反转录革元copia, gypsy和line等。细菌染色 体上的retron基因组由5'端的非转录区msr,反转录区msd和3端的反转录酶(reverse transcripiase简称rt )基因等三部分组成。8. 超基因超基因,指在真核生物中,作用于一种或一系列性状的几个紧密连锁的基因,类似于原核生物屮的操纵子,如人类的血红蛋白基因簇。功能
22、相同或相关的许多基因聚集而成基因簇.可以是基因重复产生的w个相邻的相关基因.也可以是许多个相同的基因首尾衔接的串联排列,如组蛋白基因和rrna基因,其中也可以有假基因。一个祖先基因经过重复和变异而产生的一组基因称基因家族.结构棊 因家族中各成员通常具有相关甚或相同的功能。共同的祖先棊因通过各种变异产 生的结构大致相同.面功能不尽相似的一大批基因.虽属不同基因家族.可总称为-个超家族。在成簇的基因家族中,通过染色体重排而分散到k他位置上的成员,称为孤儿基因。9. 印记基因印记基因,指功能受到双亲基因组的影响而被打上雌雄亲本特异标记的基因,为哺乳动物的基因组特有.实质是双亲相应基因的甲基化程度不同
23、。印记产生于生殖细胞发育期,恒定于胚胎发育期,消除于性腺形成期并同时产生自身新的印记。在胚胎和成体的二倍体体细胞中.源于父本或母本的等位基因有选择性表达特征。印记基因表现为单亲依赖性遗传,无论遗传物质来自双亲中的哪一方,均具相同的表型效应,等位基因不会因为位于不同亲代来源的染色体上而产生不同的效应,这与孟徳尔遗传规律相悖.似乎能作为不同亲源等位基因的可识别标记,故称。印记基因的概念萌生于杂交双亲遗传效应的不同,最早可追溯到数世纪前.伊拉克人发现驴和马正反交.其子代有驴骡和马骡的差异。但直到20世纪50年代末,才首次发现果蝇白眼基因座的一些等位基因在子代中的不同表达,取决于该等位基因是來源于父本
24、还是母本;80年代屮期,科学家研究小鼠胚胎发育时发现雌雄个体的基因组对胚胎发育的作用有差异;1991年.第一个印记基因igf2在小鼠基因组中被发现。印记基因主要有以下特点:印记基因遍布于整个基因组中.人类基因组中约有100个印记基因;有些印记基因聚集成簇,形成染色体印记区;尽管有些印记基因紧密连锁,但却表现出不同的印记效应。如:小鼠7号染色体远端的igf2基因和h19基因连锁,但igf2是母亲印记失活基因,h19则是父亲印记失活基因;印记基因的内含子一般均较小.内含子/外显子长度之比也较小,雄性印记基因的重组率高于雌性印记基因;表达具奋组织特异性。据此研究者认为,基因是一个化学实体,实质上是d
25、na分子中具有遗传效应 的一段特定的核苷酸序列。而所谓的“遗传效应”就是对蛋白质合成有直接或间 接影响的部分,有遗传效应的dna片段就是能够直接指导或间接调控蛋白质合成 的碱基序列。那么从这个角度来看,调控单元中“操纵基因”的概念是具有一定 的合理性的,因为虽然它只是一个蛋白结合位点,并不编码产物,但是却能够影 响临近基因的表达从而间接调控蛋白质的合成。三、基因组计划后基因概念的发展20世纪70年代,dna克隆和测序技术发展并逐步成熟,噬菌体ms2成为第 一个基因测序和完成全基因组测序的生物,以后又有很多生物完成了全基因组 测序。于是人们开始研发进行棊因注释的计算机运算法则,这些运算法则对棊因
26、 的注解主要是基于其序列的特点,尤其基因全部编码区或称“开放阅读框(open reading frame, orf)的特点。这吋很多基因指的是一些特殊的dna序列,因为他 们和己经注解的基因序列相似,后者则是20世纪50年代到70年代揭示的一些 dna功能。这些注解基因被称为“名义的基因”。在一定意义上,这时的基因其 实是基因组中注解的orf。现在对基因的注解也主要基于其序列特点,如国际人 类基因组组织(11ug0)将基因解释为“可以影响基因型或功能的dna片段”。从这个角度看来,操控基因的确是特殊的片段,通过调控间接影响着基因型 的产生,多少也符合基因的意义了四、encode计划后基因概念的
27、发展encode计划的最新一批研宂成果,使关于人类基因的传统理论受到挑战, 首先,人类基因蓝图不是由孤立的基因和大量“垃圾dna片段”组成的,所谓的 垃圾基因实际上非常少,蛋白编码基因只不过是众多具有特定功能的dna序列元 件的一种。单个基因、调控元件以及与编码蛋白无关的其他类型的dna序列一道, 以交叠的方式相互作用,形成一个复杂的网络系统,共同控制着人类的生理活 动。其次,encode计划发现了更为普遍的非编码rxa (ncrnas)。人类基因组中 有93%的dna都会转录成rna,众多转录本为非编码rna,这些转录本可以发生相 作用。还有,encode计划发现了更为复杂的选择性剪接。单个基因可以产生一 个以上的蛋白质。在选择性剪接过程中,一个细胞可以选择不同的外显子组合制 作出不同的副本。
0/150
联系客服
本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。人人文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知人人文库网,我们立即给予删除!