|
将外源基因通过体外重组后导入受体细胞,使该基因能在受体细胞内复制、转录、翻译和表达,整个操作称为基因重组技术。要实施该技术必须具备四大要素:工具酶、载体、基因和受体(宿主)细胞。
一、工具酶: 基因工程的基本技术是人工进行基因的剪切、拼接、组合。基因是一段具有一定功能的DNA分子,要把不同基因的DNA 线形分子片段准确地切出来,需要各种限制性核酸内切酶(restriction endonuclease);要把不同片段连接起来,需要DNA 连接酶(DNA ligase);要合成基因或其中的一个片段,需要DNA 聚合酶(DNA polymerase)等。因此,酶是DNA 重组技术中必不可少的工具,基因工程中所用的酶统称为工具酶。 工具酶就其用途而言可分为三大类:限制性内切酶、连接酶和修饰酶,其中限制性内切酶为一大类酶(达上千种)。基因重组正是利用了这些工具酶对DNA 分子进行一系列的酶催化反应,才得以在体外实现DNA 分子的切割和连接。因此,工具酶的发现为基因操作提供了十分重要的技术基础。首先重点介绍限制性内切酶(restriction endonucleases=restriction enzyme),其他酶在相关内容中再一一介绍。 从分子生物学发展历史看,核酸限制性内切酶的发现和应用对该学科发展所起的作用是难以估量的。首先使外源基因在大肠杆菌中克隆的实验是在1973 年完成的,Stanley Cohen,Herbert Boyer(见补充资料2.1)正是利用了限制性内切酶这一分子手术刀才得以实现。 核酸限制性内切酶是原核生物中的一类能识别双链DNA 中特定碱基顺序的核酸水解酶。原核生物的限制和修饰系统犹如高等动物的免疫系统,依靠一对识别相同序列的核酸限制性内切酶和甲基化酶活性来对抗外来DNA 的入侵:当自身的基因组在复制完成下轮DNA 复制尚未开始前就被甲基化酶修饰(使某特定序列甲基化), 避免了被对应的限制性内切酶的识别和水解,而入侵的噬菌体由于未来得及修饰而被破坏,从而保护细菌不受噬菌体的感染。各种细菌都能合成一种或几种顺序专一的核酸内切酶。这些酶的功能就是通过特异性序列的识别后进行DNA 的切割,来限制外源性DNA 侵入自身的细胞内,所以称这种核酸内切酶为限制酶。 根据酶的识别切割序列的特性、催化条件以及是否具有修饰酶的活性而分成三类:I、II、III类: 第I 类限制性内切酶是双功能酶,具有修饰活性(甲基化)和内切酶活性,作用时需要消耗ATP,能识别专一的核苷酸顺序,并在距离识别点大约1000 个核苷酸对处切割DNA 分子中的双链,但是切割的核苷酸顺序没有专一性,是随机的。 (实验频道 ) 第II 类限制性内切酶只具有核酸内切酶活性,能识别专一的具有回文结构的核苷酸顺序,并在该顺序内的固定位置上切割双链,作用时不需要水解ATP 提供能量。 第III 类限制性内切酶也同时具有修饰活性和内切酶活性,具有专一的识别顺序,但不是对称的回文顺序。它在识别顺序旁边24-26 个核苷酸对的固定位置上切割双链,但这几个核苷酸对则是任意的。 其中II 类酶在基因重组中最有应用价值。因此以下内容均以II 类限制性内切酶为主。
1.限制性内切酶的命名和书写 限制性内切酶主要是从原核生物中提取的。现在通用的命名原则是:第一个字母是细菌属名的第一个字母,第二、三个字母是细菌种名的前二个字母,这些字母都用斜体字书写;如果同一生物种内又分为不同的血清型和菌株,其菌株名称的第一个字母,用正体字书写,并放在限制酶名称的第三个字母后面。比如限制酶HincⅡ和HindⅢ 則是分別來自流感嗜血菌(Haemophilus influenzae)的c 和d 血清型菌株。如果同一菌株中有几种不同的内切酶时,则分别用罗马数字Ⅰ、Ⅱ、Ⅲ……来代表,如表2.1 所示。
表2.1 几种限制性内切酶的来源
2.限制性内切酶的特点: ①识别特定的核苷酸序列:长度一般为4~6bp 并具有回文结构的顺序(palindromes,一段自我互补的DNA 顺序,即上下链从5’→3’方向所读的顺序完全一样)。 例如:
②具有特定的酶切位点:即在识别序列的特定位点对双链DNA 进行切割,由此产生特定的酶切末端。通常双链DNA 被酶切后可出现三种形式的末端:5’突出的粘末端;3’突出的粘末端;平末端。 ③由两种酶分子组成的二元系统:一种是限制性内切酶,另一种是甲基化酶,二者识别位点相同,但后者不是切割,而是对识别序列中的一个碱基进行甲基化修饰,该甲基基团伸入到双螺旋的大沟中去,阻碍了限制性内切酶的作用,使之不受对应的限制性内切酶的切割。对于原核生物来说,甲基化酶对其自身DNA 序列进行甲基化,使其免受限制性酶的作用,因此甲基化酶是细菌体内的一种保护机制。换言之,正是由于限制性内切酶与甲基化酶,组成了原核生物的一个完整的免疫系统。
3.应用限制性内切酶注意事项: 酶单位(U)的定义:在50μl 反应液中, 37℃保温1h, 使1μg 的特定DNA 完全分解所需的酶量为1 个活性单位。由于酶的活性与其所处的反应条件有很大的关系,因此在使用限制性内切酶需注意: ①反应条件:每种酶所需的最适条件各不相同,包括:温度、不同的离子浓度、pH、还原剂等,因此为了保证酶处于最佳反应条件,每种酶必须备有配套的缓冲系统(buffer)。 ②DNA 的纯度是影响反应效率的主要因素,杂质包括:蛋白质、酚、氯仿、乙醇、EDTA、SDS、以及高浓度的盐离子。降低污染的办法:适当增加酶的用量、扩大反应体积(通过稀释降低污染物的浓度),或延长反应时间。 (实验频道 ) ③注意甘油的浓度(酶储液),所提供的缓冲液均为10 倍浓缩液,目的是保证稀释的酶保存液中甘油的浓度不会超过5 %。但较小的反应体积更容易受到移液器误差的影响,因此酶切反应体系不宜在体积过小(如小于20μl)范围中进行。 ④注意反应液的充分混合,但不可振荡。反应液充分混合是为了保证反应完全,推荐用取液器反复吸取混合,或是用手指轻弹管壁混合,然后再快速离心即可。 上述只是一些基本原则,实际操作中需要综合考虑。一些大的试剂公司均会提供各种限制性内切酶的详细资料。 特别强调的是,并不是酶量越多越好,反应时间越长越好,因为限制性内切酶都有Star 活性,即发生非特异性的反应(所谓Star activity,是在一些特定的条件下,酶对底物DNA 的特异性可能降低,以致在识别序列以外的位点进行切割。在甘油含量高、酶量大,有机溶剂以及盐浓度低时容易发生);同时酶在保温过程中,活性也会发生变化。 为了能够正确的利用限制性内切酶,应该注意阅读产品说明书以及相关的介绍。例如:各种限制性内切酶在保温过程中的活性变化表;双酶切反应时的通用缓冲液使用表;不同缓冲液中各种限制性内切酶的活性变化表等等。另外需要注意的是,不同公司产品的酶和缓冲液不要混用。(见附录四-1,常用限制性内切酶表) 在多数情况下,同一种限制性内切酶所产生的DNA 双链末端结构总是相同的,因而用同一种限制性内切酶酶切同一个或两个不同来源的DNA 分子所产生的末端都可以相互配对,在DNA连接酶的作用下,3'和5'末端重新形成磷酸二酯键,而成为一个重组的DNA 分子。 由于这些限制性内切酶的识别序列都是对称的,因而两个DNA 片段可以从两个不同的方向连接起来。这种外源DNA 片段的插入没有一定的方向,这对插入片段的方向并不显得重要时适用,如在构建基因文库时。然而在研究基因表达时,考虑外源DNA 的插入方向则是十分重要的,需要采取不同的方式进行控制,以达到定向连接的目的。(实验频道 ) 虽然不同种的限制性内切酶产生的DNA 双链末端结构在大多数情况下是不相同的,但有些不同种限制性内切酶产生的末端却是相同的,即具有相同类型的突出末端(都是5'端或3'端突出),突出的核苷酸数目相等且序列也相同,因而可以互相连接起来。这种由不同种的限制酶产生的能相互连接的末端常称之为相容性末端,这些酶则称之为同尾酶(isocaudamer)。 例如,限制酶BamH I 和 BglⅡ都能识别各自的6 核苷酸序列,且切点都在同一位置,依次为GGATCC 和AGATCT, 因此产生的DNA 片段都产生一个相同的单键5'端突出 (突出序列是GATC)。当这些酶作用DNA 分子后,它们都能相互连接,但是新形成的DNA 分子将同时失去这两种酶的识别序列。如:
通常,不同的限制酶具有不同的识别序列,但有些不同来源的酶能识别相同的序列,这些酶被称为同裂酶(isoschizomer),不过其中有些酶具有相同的切点,而有些酶的切点却并不相同,如Acc Ⅲ与BspEⅠ、BseAⅠ、BsiMⅠ、Bsp 131、Kpn21、MroⅠ识别序列都是TCCGGA,t 它们的切点都在T 和C 之间,即T/CCGGA;但BbeⅠ与KasⅠ、NarⅠ、SfoⅠ识别序列都是GGCGCC,但它们的切点分别为GGCGC/C、G/GCGCC、GG/CGCC、GGC/GCC。 现在已从各种微生物中发现三千余种限制酶,它们识别序列的长度最短的是4 个核苷酸,最长的为8 个核苷酸。基因克隆过程中使用频率最高的是识别6 个核苷酸的限制酶。这是因为由4个核苷酸组成的识别序列在DNA分子中出现的频率很高,如果按完全随机分布的原则,每44=256个核苷酸可出现一个相同的4 核苷酸识别序列。如果是由6 个核苷酸序列组成的限制酶识别位点,那么就应该有46=4096 bp才可能出现一次。识别8 个核苷酸的限制酶识别位点就应该有48=65,536 bp才重复一次。因此,在一个DNA分子中,识别4 个核苷酸的限制酶位点太多,识别8 核苷酸的限制酶位点又太少。换句话说,识别4 核苷酸的限制酶将DNA切得太短,识别8 个核苷酸的限制酶将DNA切得太长,而识别6 个核苷酸的限制酶则比较适中,切下的DNA片段平均长4.1 kb左右。除此之外,片段过长或过短,从技术角度讲,操作起来也不太方便。
实际上,任何一种生物基因组的DNA 分子中的核苷酸分布并不是完全随机的。也就是不同物种的基因组DNA 中,所含的限制性内切酶位点的种类和数量各不相同。也正由于此,可以通过绘制限制性内切酶图谱来描述某一个物种的基因组特征,即物理图谱。
比如,在SV40 ( Simian vacuolating virus,猿猴空泡病毒)的DNA 分子中 (基因组长为5,243 bp)仅有一个Hpa II 位点 (识别序列为 C↓CGG),而Tha I 位点 (识别序列为CG↓CG) 则根本没有。但是,在大小相似的原核生物DNA 分子中,如最常见的大肠杆菌质粒载体pBR322 (总长4,363 bp)则有26 个Hpa II 位点和23 个Tha I 位点。 在一个含有75% AT 和25% GC 的DNA 分子中,长达262,144 bp 中只有一个Sma I 位点 (识别序CCC↓GGG)。 一种裸藻( Euglena gracilis ) 的叶绿体DNA 分子(130,000 bp) 中因没有Sma I 位点,而无法用Sma I 将其切为两段。 因此使用DNA 限制性内切酶的过程中,需要根据不同的研究目的来选择。比如在建立基因组文库时,DNA 片段要求尽可能长一些以便使这些片段含有完整的基因,这就需要选择一些限制酶,它们的识别序列在该生物DNA 分子中应当是一些不常见的核苷酸序列;而在绘制限制酶图谱时,选择的限制酶则应该识别较为常见的识别序列。表2.2 列出一些限制酶消化不同物种的基因组DNA 获得的平均DNA 片段的长度。 表2.2 一些限制酶消化不同物种的基因组DNA*获得的平均DNA 片段的长度(bp)
*基因组DNA 的总长度:E.coli,4.6Mb;S.cerevisiae,12.1 Mb;C.elegans,100 Mb;D.melanogaster,3.8 Mb;H.sapiens,22 Mb
二、载体(Vectors): 一种能够结合外源DNA 片段形成重组DNA,并能进行自我复制的DNA 分子称为Vectors。最主要的载体是质粒、噬菌体和病毒,分别应用于原核细胞或真核细胞。从功能来分,有克隆载体(构建基因组文库或cDNA 文库)、测序载体、表达载体以及能在两个不同物种中存在的穿梭质粒。随着生物技术的发展和科学研究的深入,不断出现具有不同功能的新载体,如可以容纳几百万碱基的酵母人工染色体。载体的具体种类有:
PAC (P1 衍生人工染色体) MAC(哺乳动物人工染色体)
这些载体均有各自的特点,表2.3 中列出它们的主要特性。 表2.3 各种克隆载体特性的比较
1.质粒(plasmids) 质粒是细菌内的共生型遗传因子。作为染色体外小型双链环状DNA 复制子,它能在细菌中垂直遗传并且赋予宿主(受体菌)某些代谢活动和抗药表型,是比病毒更简单的原始生命。质粒由Lederburg 发现并于1952 年正式命名。由于质粒不仅可以携带外源基因进入细菌中进行扩增和表达,而且在添加真核复制信号和启动子后,构建出能在原核或真核细胞中均可复制的穿梭质粒,使外源基因在真核细胞中得以表达,因而成为基因的运载工具(即载体),在基因工程中具有极广泛的应用价值。质粒并不是宿主染色体的永久组成部分,而是一种自主复制的遗传单元。不同质粒DNA 的复制,其机理不尽相同,根据质粒拷贝数的不同,分为严紧型和松弛型,前者与宿主的繁殖结合,致使每个细胞仅有一个或几个拷贝质粒,而后者却是由质粒自己编码的基因合成功能蛋白所调节,因此在宿主染色体复制停止的情况下,质粒可以继续扩增,因而具有10-200 个 拷贝数。对于克隆载体,松弛型质粒更为适用。 天然质粒不足以用为载体,必须根据基因克隆的要求进行体外修饰改造。因此可以用作载体的质粒需具备一定的基本元件后才有相应的功能。
(1)质粒(载体)具备的基本元件: ①复制起始点(ori):使质粒可以自我复制和扩增。 ②抗生素抗性基因:一般有两个,以便为受体菌提供易于检测的表型性状的选择记号,而且在外源基因插入后形成的重组质粒中,至少仍保留一个强选择记号。常用的抗性有:抗氨苄青霉素基因Ampr、抗四环素基因Tet r、抗卡那霉素基因.Kanr、抗氯霉素基因Cml r、抗链霉素基因Strr 。 ③若干限制酶单一识别位点(多克隆位点,polylinker):满足各种基因克隆的需要,而且外源基因插入后不影响质粒的复制功能。 ④较小分子量和较高拷贝数:便于进行分子操作和质粒扩增。 典型质粒pBR322 的物理图谱(图2.1)和pUC18/19 的物理图谱及多克隆位点(图2.2)
图2.1 pBR322 质粒物理图谱
图2.2 pUC18/19 质粒多克隆位点顺序
(2)质粒的功能: ① 运载外源DNA片段:质粒通常用于运载小于15kb的外源基因片段到宿主中。为了便于操作,人们又构建了穿梭质粒(Shuttle plasmids)。所谓穿梭质粒是指一类人工构建的具有两种不同复制起点和选择标记,因而可以在两种不同类群宿主中存活和复制的质粒载体[1]。此概念不仅用于不同的微生物菌群之间,也可以推广到真核生物表达载体的构建,如用于枯草的pBE2、酵母的pPIC9K、哺乳动物表达载体pMT2 和用于植物细胞的Ti 质粒。这些穿梭质粒不仅可以在大肠杆菌中复制扩增,也可以在相应的枯草、酵母、动物或植物细胞中扩增和表达。由于大肠杆菌的培养、基因重组、扩增、测序等工作易于进行,技术也相当成熟,因此利用穿梭质粒把要表达的基因组装好后,再转入相应的细胞中进行表达,这无疑给基因工程操作,特别是以真核细胞为表达体系的工作提供了极大的方便。 ② 筛选重组子:通常以质粒的抗生素抗性基因作为筛选的遗传标记。当外源基因插入质粒的某一个抗性基因中,就使该抗性基因不能正常表达,致使含有该质粒的细菌丢失抗性。利用抗性的变化,很容易筛选出含有外源基因的重组子(见图2.3)。
图2.3 pBR322 质粒克隆DNA片段的筛选(tetr失活)
质粒除有抗性基因外,往往还带有其他明显的筛选标记,最常用的是蓝白斑筛选(β-半乳糖苷酶系统)。其基本原理可见图2.4,此类载体携带lacZ’基因,它编码β-半乳糖苷酶的N-末端(α-肽),并且处于可被安慰诱导物IPTG(异丙基硫代半乳糖苷,与乳糖结构类似但不能被β-半乳糖苷酶降解)诱导的启动子调控之下。质粒转化的宿主菌为LacZ△M15 基因型(含有编码N-末端缺陷型的β-半乳糖苷酶多肽的基因)。未重组的质粒转化宿主菌后,在IPTG 的诱导下,质粒与基因组分别表达缺陷但可以相互补偿的两个肽(即α-互补),形成了有功能的β-半乳糖苷酶,该酶能把培养基中无色的X-gal(5-溴-4-氯-3-吲哚-β-D-半乳糖苷)底物分解成半乳糖和深蓝色的5-溴-4-氯-靛蓝。然而当外源DNA 插入质粒位于α-肽编码序列中的多克隆位点时,由于破坏了α-肽的阅读框架,因而不能表达出与宿主菌基因组表达的缺陷型β-半乳糖苷酶多肽发生α-互补。 由于没有β-半乳糖苷酶的酶解作用,致使重组菌形成白色菌落。由此,可以借助蓝白斑很容易筛选出重组子。不过实际操作中发现当插入小片段时,重组子也有形成浅蓝斑的情况。据最新报道,大概有30%的假阴性,即蓝色菌斑也有可能含外源基因,同时还会出现一定程度的假阳性。
尽管蓝白斑筛选应用了二十余年,但假阳性和假阴性却经常出现,促使人们不断对分子克隆方法提出改进,并思考着建立新的载体和克隆技术。但迄今为止,几乎没有一个克隆系统可以保证不会出现假阳性克隆。Slilaty SN和 Lebel S.研究证明[2],蓝白斑筛选的载体,通常将插入位点放在LacZ’基因的起始密码子ATG到第7 个氨基酸密码子之间。但如果将插入位置改变到LacZ’基因的第11-36 个氨基酸密码子之间,那么就可以完全消除假阳性和假阴性。Genomics One公司正是利用了他们的研究结果开发出TrueBlue技术,同样是蓝白斑筛选,但准确率可达100%。 ③ DNA 测序:为了便于对克隆到质粒中的外源DNA 片段进行鉴定,必须进行DNA 序列的测定。通常克隆质粒(包括某些表达质粒)中位于多克隆位点两侧含有通用引物,因此无论插入何种DNA 片段,均可利用通用引物进行测序,而不必另外设计特异测序引物,如pGEM-T 载体(图2.5)。
图2.5 pGEM-T载体多克隆位点及相关序列位点 相关的序列位点为: T7 RNA 聚合酶转录起始位点 1 多克隆位点区 10-113 SP6 RNA 聚合酶启动子(-17 至+3) 124-143 SP6 RNA 聚合酶转录起始位点 126 pUC/M13 反向测序引物结合位点 161-177 lacZ 起始密码子 165 lac 操纵子 185-201 β内酰胺酶编码区 1322-2182 噬菌体f1 区 2365-2820 lac 操作子序列 2821-2981,151-380 pUC/M13 正向测序引物结合位点 2941-2957 T7 RNA 聚合酶启动子(-17 至+3) 2984-3
在该载体多克隆位点两侧有两对通用引物(SP6 RNA 聚合酶启动子、T7 RNA 聚合酶启动子和pUC/M13 反向测序引物、pUC/M13 正向测序引物),它们均可以用来对插入的任何片段进行测序。 ④ 表达外源基因:许多表达质粒均构建了强启动子,外源基因可以在该启动子的控制下实现高表达,获得大量目的蛋白。表2.2 列出能在大肠杆菌中常用的一些高表达启动子。
表2.4 大肠杆菌高表达启动子
引自:Hanning G and Makrides S.C, Strategles for optimizing heterologous protein expression in Escherichia coli,Trends in Biotechnology,1998,16(2):54-60
(3)质粒的电泳行为: 电泳是分离鉴定生物大分子的常规方法,大分子的电泳行为(迁移率)取决于该分子的大小、空间结构和携带的电荷量。利用不同的染料可以用肉眼观察它们的电泳行为。 溴乙锭(ethidium bromide,EB)是一种具有扁平结构的荧光染料,可以嵌入核酸分子中的碱基对之间,在紫外线的激发下发出红色荧光,同类型核酸的荧光染色强度与核酸浓度成正比,灵敏度可达1-5ng,因此它是常用的核酸染料。(实验频道 )
质粒DNA 的形态不一,其电泳行为有差异,电泳时在凝胶中表现出的迁移率不同。超螺旋质粒DNA 由于结构紧密迁移速度最快;结构松弛的开环(缺口)质粒DNA 最慢;而线形DNA位于两者之间。图2.6 中的4、5 泳道出现三条区带,最前面的亮带即为超螺旋质粒,后面两条弱带分别为线形化质粒和开环质粒。当质粒被酶切后,三种不同形态的质粒均变为线形,于是出现为7、8 泳道的结果,即仅出现线形的亮带。当质粒与分子量标准(marker)进行比较时,必须将质粒线形化后才具有可比性。
分子量标准(marker);4. 5.为质粒;2. 7. 8. 为经酶切后的质粒
2.噬菌体和病毒(bacteriophage and virus) 利用噬菌体和病毒具有感染宿主(受体细胞)的能力,将插入的外源基因带入宿主中。噬菌体是一类侵害细菌(包括放线菌、真菌和原核生物,即宿主菌)的病毒,又称细菌病毒(bacterialvirus)。它具有其它病毒的共同特性:个体小、可通过除菌滤器、没有细胞结构、非常专一的寄生性等,为非细胞生物。其结构主要由蛋白质和核酸(DNA 或RNA)组成。在自然界中分布广泛,土壤、空气、水中或生物体内都可存在。根据噬菌体与宿主菌的关系可分为烈性噬菌体(virulent phage)和温和噬菌体(temperate phage)两类。前者能改变宿主菌的性质,大量产生新的噬菌体,最后导致宿主菌裂解死亡;后者可因生长条件的不同,既可引起宿主菌的裂解死亡(lytic phage),又可将其核酸整合到宿主菌的染色体上,使宿主菌继续生长繁殖,并被溶源化 (lysogeny,即噬菌体的核酸附加于宿主菌的遗传物质上,随同宿主菌分裂一起进行复制)。噬菌体的研究历史,是同分子生物学、分子遗传学的创立和发展过程密切相关的。DNA 复制机理的阐明、转录的终止作用、连接酶和解旋酶的发现、位点特异的重组作用、SOS 修复机制等,均是以噬菌体为材料取得的重要研究成果。分子生物学技术常用的噬菌体有: ① λ 噬菌体:外形特征类似于蝌蚪,由头和尾组成,头部呈等轴的20 面体,直径约54nm,尾部无尾鞘,长150nm,主要由衣壳蛋白组成。其基因组为线状双链DNA 分子,长约49kb,约含50 个基因,其中50%的基因对噬菌体的生长和裂解寄主菌是必需的,分布在噬菌体DNA 两端(即为左右臂);中间是非必需区,当它们被外源基因取代后,并不影响噬菌体的生命功能。由外源基因取代非必要基因所形成的重组DNA,可以随寄主大肠杆菌细胞一起复制和增殖,而且在其溶源周期中,它们的DNA 是整合在大肠杆菌染色体DNA 上的,成为大肠杆菌的一个组成部分,因此改造后可以组建一系列具有不同特点的载体分子。因λ噬菌体具有:a.λ-DNA 可在体外包装成病毒颗粒,高效地感染大肠杆菌;b.可以把25kb 长的外源DNA 插入λ-DNA,引入受体细胞;c.重组λ-DNA 的筛选和保藏较易。故λ 噬菌体常作为分子克隆的载体,而且特别适用于构建真核 生物基因文库。
图2.7 噬菌体形成透明噬菌斑
噬菌体在液体培养基中,噬菌现象可使浑浊菌液变为澄清,在固体培养基中,若用适量噬菌体和宿主菌液混合后接种培养,培养基表面可有透亮的溶菌空斑出现(图2.7)。一个空斑是由一个噬菌体复制增殖并裂解细菌后形成的,称为噬菌斑(plaque)。在基因重组中,噬菌斑是噬菌体重组包装成功的筛选标志。将噬菌体按一定倍数稀释,通过噬斑计数(滴度),可测知一定体积内的噬斑形成单位数目,即噬菌体的数量。图2.8 为噬菌体感染宿主菌的整个过程,包括登陆、销栓固定、尾部收缩并穿透、最后将DNA 注入宿主菌内。
图2.8 噬菌体感染模拟图
② M13 噬菌体:是一种独特的载体系统:为6400bp 的单链DNA,整个基因组编码10 个基因(图2.9)。它只能侵袭具有F 基因的大肠杆菌,但不裂解宿主菌。进入宿主菌后成为双链环状分子,能象质粒一样自主复制 (即复制型,RF),制备方法同质粒。宿主菌可分泌含单链DNA 的M13 噬菌体,又能方便地制备单链DNA,用于DNA 顺序分析、定点突变和制备单链核酸探针,同时不存在包装限制问题。因此作为单链DNA 载体,它具有其它载体所不具备的优越性。
③ 柯氏(Cos)质粒:是一种人工构建的克隆载体,为克隆真核DNA 大片段而专门设计的。它包含了λ 噬菌体的cos 基因、用于克隆的限制性内切酶位点、抗药性标记和质粒的复制原点,因此是有噬菌体DNA 粘性末端顺序的质粒DNA 分子, 如pHC79(图2.10)。柯斯质粒能被包装到λ噬菌体粒子中,感染大肠杆菌。此类载体分子容量大,可携带45kb 的外源DNA 片段。也能象一般质粒一样携带小片段DNA,直接转化宿主菌。这类载体常被用来构建高等生物基因文库。
④ 腺病毒(Adenoviral)载体:腺病毒的形态是特征性的二十面体病毒壳体,直径为60~90nm,没有囊膜,衣壳由252 个壳微粒组成,主要含有三种蛋白:六邻体(II),五邻体基底(III)和纤突(IV),还有多种其他的辅助蛋白VI,VIII,IX,IIIa 和Iva2,其中240 个壳微粒是六邻体(Hexon),位于20 面体顶端的12 个壳微粒是五邻体(Penton),每个五邻体由基底和伸出表面的一根末端有顶球的纤维组成(图2.11)。腺病毒基因组是一个线性的双链DNA,其5'端与一种末端蛋白(TP)共价结合,5'端上还具有末端反向重复序列(ITRs)。病毒DNA 与核心蛋白VII 和一个称为mu的小肽紧密结合。另一种蛋白V 包被在DNA-蛋白复合物上,并且通过蛋白VI 为DNA-蛋白复合物和病毒壳体间提供了结构上的联系。病毒含有一种病毒自身编码的蛋白酶,这种蛋白酶对于加工某些结构蛋白从而产生成熟的具有感染性的病毒是必需的。腺病毒颗粒可以转染各种细胞,具有高感染率、低变异、高表达的特性,拷贝数可控制,插入片段可达8kb,是非常有用的真核细胞的表达载体。
图2.11 腺病毒结构示意图
⑤昆虫杆状病毒(Baculoviruses):是对昆虫具有专一性的杆狀病毒(图2.12),对于其他种类的細胞不具感染性。它是一种长杆狀的病毒,长约200~400nm,宽约40~50nm,染色体DNA长度在80~200kb之间。当病毒成熟时,在病毒鞘外会包裹一层多角体蛋白,包裹完整的杆状病毒形成包含体 (Occlusion Body,OB),可以保护病毒抗紫外与抗旱。野生型的杆状病毒是一种安全的生物杀虫剂,对其改造后已成为有效的真核表达载体、表面展示系统、以及基因治疗载体[3]。
昆虫细胞和杆状病毒组成了一个完整的表达系统,已经被证明是高水平表达哺乳动物全长蛋白的方法[4]。在昆虫细胞中很多翻译后修饰类似于哺乳动物细胞,而那些在大肠杆菌中不能成功表达的蛋白也可以利用杆状病毒系统在昆虫细胞中进行表达。因此BES(杆状病毒表达系统)具备以下优点:具有真核细胞的翻译后修饰功能;正确的蛋白折叠、二硫键形成,使重组蛋白在结构和功能上更接近天然蛋白;高表达量,最高表达量可达昆虫细胞蛋白总量的50%;可表达非常大的外源基因(~200kD);具有在同一个感染昆虫细胞内同时表达多个基因的能力;对脊椎动物是安全的。
图2.12 昆虫杆状病毒
3.人工染色体(Artificial Chromosomes) 所谓人工染色体是利用染色体片段组成的载体 (图2.13)。同质粒一样,由从染色体分离出来的ARS(autonomous replication sequences,DNA自主复制起始序列)、CEN(centromeric sequences,着丝点序列)和TEL( telomeric sequences,端粒序列)组成。当然作为载体还必须有克隆位点和筛选标记。其最大的特点是能容许100-2000kb大片段的外源DNA的插入,这对于进行基因组工程的工作带来方便,使得用不多的克隆就可以包含特定的基因组全部序列,这样可以保证基因组特定序列的完整性[5、6]。因能包容大而复杂的基因,利用哺乳动物人工染色体,还可以进行功能分析以及基因治疗。在人类基因组计划和其他基因组研究中,人工染色体发挥了不可替代的作用。
图2.13 人工染色体示意图 CEN 4 是染色体4 的着丝点,TRP1、URA3 和SUP4 为选择性标记基因
三、基因: 得到多拷贝目的基因或外源基因并获得表达是克隆的根本目的,但首先要得到含有该基因的模板,因此分离原始基因是必要的。(实验频道 ) 基因的来源一般可以从以下几个途径获得: 1.染色体DNA: 生物体的所有基因均存在于染色体中(对于真核生物,部分较保守的基因还存在于线粒体DNA,即mtDNA 中)。因此染色体DNA 的提取在分子生物学实验中是一种常规技术。 对于原核生物的基因可以通过以下两种方法得到:
特点:由于染色体包含所有的遗传信息,因此构建难度大(特别是单拷贝基因,或长片段基因),同时也给筛选带来很大难度(尤其是工作量非常大), 并且不能直接把这种基因用于原核表达,因为序列中会有内含子。 应用:用于研究基因在基因组中的真实分布情况。
2.RNA: 需注意的是真核生物细胞的基因不同于原核生物,其基因属于断裂基因,即编码基因序列(外显子,exon)之间存在不编码的序列(内含子, intron)。因此利用特异性引物,从真核细胞染色体DNA 中,直接通过PCR 来获得编码该基因往往是不可行的。对于真核生物的基因来源,应该主要从RNA 中获得,特别是mRNA。但实际提取的RNA 是总 RNA,其中包括hnRNA(mRNA)、tRNA、rRNA、snRNA 等。因此要获得mRNA,必须从总RNA 中进行纯化。但事实上,现在利用RT-PCR 可以很方便地从以下方法得到目的基因: 特点:cDNA 仅包含正在转录和表达的基因。由于它们受时空和环境的调控,因此即使是相同物种,在不同发育阶段、或来源于不同组织,所得的cDNA 文库不尽相同。不过与基因组相比,由于基因总量少,相对来说筛选的工作量小、筛选也较容易。
3.化学合成基因: 随着科学技术的发展,DNA 合成技术有了大幅度地提高,致使成本大大降低,因此对于小片段基因可以采用合成的方式,即利用DNA 合成仪直接合成获得。 由于合成过程存在一定的错配率,而且错配率随合成片段的长度增加,因此通常对大于50-60 个核苷酸长度的片段,采取分段进行,然后进行拼接获得全长片段。利用合成获得基因,可以不受原始材料的限制,同时还可以根据受体细胞基因编码偏爱性来选择密码子,更有利于高表达。 根据互补的程度,拼接有两种方式,一种是完全通过合成片段之间的完全碱基互补形成粘末端双链,另一种是末端互补,通过PCR 延伸获得双链。 第一种方式的实例如图2.14[7]所示:
图 2.14 人工合成基因方式一――完全合成互补片段拼接
整个基因的总长为215bp,分成长度为24~39 个碱基不等的12 个寡核苷酸片段,共合成6对片段。取等浓度的各片段分别进行5′-OH 基磷酸化(防止环化),然后混合退火加入T4 DNA连接酶连接过夜。最后以连接产物为模版, 以基因两端带有酶切位点的片段为引物进行PCR 扩增,获得大量可以克隆到载体中的完整基因的片段。 第二种方式实例如图2.15[8]所示:
图2.15 人工合成基因方式二――合成与PCR 结合
该基因长度为360bp,分成8 个相互之间具有一定互补碱基的引物,分别合成后再通过PCR进行分步延伸拼接:首先将引物F3、R4 和引物F4、R3 分别混合,通过变性和缓慢降温,达到互补碱基之间退火,然后在Taq DNA 聚合酶的作用下使引物获得延伸;得到的PCR 产物分别命名为S1 和S2;第二步PCR,是将S1 和S2 混合退火,并以此为模板,在引物F2、R2 的引导下,延伸获得片段命名为S3;第三步PCR 以S3 为模板,加入引物F1、R1,最后获得了与原设计一致的360bp DNA 片段。
四、受体细胞: 受体细胞的选择是否合适将关系到能否表达,特别是高效表达。 首先要注意不同的表达载体与受体细胞的关系,即原核表达载体适合原核细胞,真核载体则适合真核细胞,而农杆菌仅适用于植物细胞。即使大肠杆菌质粒,也应注意选择合适的菌种。例如,当用含有T7 噬菌体启动子的载体表达外源基因时,由于T7 启动子只能被其本身的RNA 聚合酶(T7 RNA 聚合酶)所识别,所以必须使用具有产生T7 RNA 聚合酶能力的受体菌,如:BL21(DE3)、JM109(DE3)。对于一些缺失β-D-半乳糖酶氨基端的受体菌,则适合用带lacZ△M15基因的质粒(如:pUC),以便实现β-D-半乳糖酶α互补,进行蓝白斑筛选。 1.选择受体细胞的一般原则: ①易于接纳外源DNA; ②无特异的内源核酸内切酶; ③载体复制、扩增不受阻; ④与载体有互补性。 根据不同的需求,还应考虑: ①表达载体所含的选择性标记与受体细胞基因型是否匹配; ②遗传稳定性高,易于进行扩大培养; ③受体细胞内源蛋白水解酶基因确失或蛋白酶含量低,利于外源基因蛋白表达产物在细胞内积累; ④可使外源基因高效分泌表达; ⑤对动物细胞而言,所选用的受体细胞对培养的适应性强;如:可以进行贴壁或悬浮培养,可以在无血清培养基中进行培养。 ⑥受体细胞在遗传密码子的应用上无明显偏倚性; ⑦无致病性; ⑧具有好的翻译后加工机制等。
2.受体细胞的基因型: 由于野生型大肠杆菌的基因(指没有发生突变的基因)具有可塑性,为了满足基因工程中的各种研究或生产的需求,研究人员对它们的基因组进行了改造,使某些基因发生突变或缺失,而引起大肠杆菌的性状特征(表型)发生变化。通常用基因型(Genotype),或称为遗传标记,来描述基因的变异, 野生型加“+”,突变型加“-”(但后者往往被省略),表示的方法的规则如下: ①根据基因产物或作用产物的英文名称,取其单词的第一字母,拼成三个字母并以斜体来表示。如:DNA Adenine Methylase, 即dam。 ②变异基因不同,但引起的结果相同,则用作用结果的英文名称的前三个字母斜体表示,并加上一大写字母,以示区别。如:Recombination , recA、recB、recC。 ③某个基因缺失时,在该基因型前加“△”。 ④由于某个基因变异导致大肠杆菌的特征发生变化,也可以用该特征的英文名来表示,但第一个字母要大写,并加上“+”或“r”表示有抗性, 加上“-”则表示敏感。如:Ampicillin(氨卞青霉素),抗性标记为ampr, 敏感性为amp-。
五、实验过程中菌种的保存和鉴定的重要性 实验过程中,菌种的保存十分重要,特别是那些经过筛选得到的带有阳性质粒的菌株。筛选出来的阳性菌株经常需要转接,而转接过程一方面要防止污染,同时还要防止质粒的丢失。一个最常用的措施是利用抗生素抑制那些丢失质粒的变异菌落的生长,但实际在菌落生长过程中抗生素会失效,导致杂菌污染而影响质粒的收率或蛋白质的表达量。因此注意保存原始菌是非常重要的,必要时在转接前对保存菌进行画线,挑出好的单菌落进行转接,并再保存一份新的菌种。对这种常规操作不可掉以轻心,否则损失是难以弥补的。
参考文献: 1. 李俊明、朱道银、伊正君、江山、骆旭东,分枝杆菌融合表达ICL2GFP 穿梭质粒的构建及鉴定,第四军医大学学报,2005 ;26(1):9-13 2. Slilaty SN,Lebel S.,Accurate insertional inactivation of lacZ alpha: construction of pTrueBlue and M13TrueBlue cloning vectors. Gene. 1998,213 (1-2):83-91 3. 王汉中、黄七、司艳红等,一种新颖的棉铃虫单粒包埋核多角体病毒表达系统,中国病毒学,2002,17(4):319~325 4. 洪华珠、彭建新,一株高水平表达重组蛋白昆虫细胞系的建立,昆虫学报,2001,44(3):276~280 5.黄粤、刘德培、梁植权,细菌人工染色体( BAC)及其分析和修饰方法简介,生物化学与生物物理进展,2001,28(3):309-313 ; 6.陈凡国、张学勇、夏光敏、贾继增,野生一粒小麦BAC 文库的构建和鉴定,植物学报,2002,44 (4):451-456 7. 昝云红、孙茂盛、郭仁、代长柏,水蛭素变异体I 基因的合成及其在酵母中表达的初步研究,中国医学科学院学报,1998,20(5):361-366 8. 黄亚东、苏志坚、郑青、赵文、许华、吴晓萍、胡晓辉、李校彷、刘丙萍,人转化生长因子TGF2β3 基因合成及其在大肠杆菌中的表达,中国药科大学学报,2003 ,34 (3) :264~267
|