3 污染问题
实验中应设空白对照,因为引物、各种缓冲液和双蒸水都会造成污染。而且Taq酶也可能出现污染,给分析带来困难,所以必须设置对照以排除系统误差。并且,酶也尽可能优化。 4 扩增条带的取舍
为了克服RAPD重复性差的问题,应设置重复实验。作为DNA多态性标记位点的条带是应该可重复的,重复性好是最重要的取舍指标,而带的强弱不应该作为取舍的指标。有学者认为带的强弱与其在基因组中的拷贝数有关。但据Thormann对十字花科植物分析,RAPD产物的强弱与该产物在基因组中的拷贝数无直接关系,而与引物及模板的同源性程度有关。分析一个位点时,要作全面分析,若某一个体的全部带均弱,其模板可能有问题(浓度、分子量);若某一个体的大部分带与其它个体强度一致,仅有一条或少数几条带弱,可能存在拷贝数差异。重复性不好的弱带(无规律出现的带)可能由非专一性扩增、产物间退火或其它人为因素造成,不能记录。 异源双链问题Ayliffe研究亚麻锈病菌时发现F1代中出现的一条带在亲本中没有出现,进一步研究发现这一条带是由2个等位基因组成的异源双链形成的,这2个等位基因除中间插入的38bp的序列外,其余序列相同。这种条带可以在后代中遗传,在该研究中这种条带大约占0.16%。在蜜蜂的研究中也发现了相似的问题,这种条带可以用单链核酸酶将其消除。也可以将电泳温度提高到60℃以上,使异源双链变性,以消除其影响。
非孟德尔遗传的条带 Heun等分析认为,在显示多态性的非模糊条带中有92.5%的表现为孟德尔显性遗传,其余的条带不符合孟德尔遗传,分析认为可能由不同的序列组成。一般实验中大多采用符合孟德尔遗传的条带进行分析。在连锁图谱分析中,基因型错误可以部分消除,即在F1代或1:1混合物中没有出现的条带,在其父母本中应尽可能去掉。 5 电泳分辨率问题
电泳时,基因组不同位置的扩增产物共同移动的可能性是有的,即不同分子量的扩增产物可能在电泳时没有分开而形成一条带,凝胶分离系统和基因组的亲缘关系有可能提高这种概率。一般而言,聚丙烯酰胺和银染的分辨效果比琼脂糖和溴化乙铵要高,用较长(可达到20cm)或浓度更高(2%)的琼脂糖凝胶有助于提高分辨率。当然,随着分辨率和灵敏度的提高,更可能出现实验误差。所以有人评述:最保险而简单的方法是用琼脂糖电脉分离而且只注意那些无疑而重发性高的带。但是,聚丙烯酰胺和银染所揭示的高信息量的多态性无疑可加快分子标记的鉴定过程。 6 显性标记问题
RAPD标记来自于模板DNA的复制,经过30一40次循环,扩增条带数量理论上可达2。原模板中扩增位点是纯合还是杂合已无法判断,因为纯合位点的扩增条带只相当于杂合位点的2倍,电泳时无法检测到其差别。杂交中。如果亲本一方为纯合体,F1代就可以全部表现出该条带;如为杂合体,该条带在F1中应为l:l分离,即一半后代有该条带,而另一半则没有。当然来自于多拷贝区的条带分析更为复杂
图位克隆程序
1、建立目的基因的遗传分离群体 2、找到与目的基因紧密连锁的分子标记 3、用遗传图或物理作图将目的基因定位在染色体特定位置 4、构建含有大插入片段的基因组文库 5、以与目的基因连锁的分子标记为探针筛选基因组文库 6.用阳性克隆构建目的基因区域的跨叠群 7、通过染色体步移、登陆或跳查,获得含有目标基因的大片段克隆 8、通过亚克隆获得目标的小片段克隆 9、通过遗传转化和功能互补验证,最终确定目标基因的碱基序列。 定位克隆技术主要包括以下6个步骤:
1.筛选与目标基因连锁的分子标记。利用目标基因的近等基因系或分离群体分组分析法(BSA)进行连锁分析,筛选出目标基因所在局部区域的分子标记。
2.构建并筛选含有大插入片段的基因组文库。常用的载体有柯斯质粒(cosmid),酵母人工染色体(YAC)以及P1,BAC,PAC等几种以细菌为寄主的载体系统。用与目标基因连锁的分子标记为探针筛选基因组文库,得到阳性克隆。
3.构建目的基因区域跨叠克隆群(contig)。以阳性克隆的末端作为探针基因组文库,并进行染色体步行,直到获得具有目标基因两侧分子标记的大片段跨叠群。
4.目的基因区域的精细作图。通过整合已有的遗传图谱和寻找新的分子标记,提高目的基因区域遗传图谱和物理图谱的密谱的密度。
5.目的基因的精细定位和染色体登陆。利用侧翼分子标记分析和混合样品作图精确定位目的基因。接着以目标基因两侧的分子标记为探针通过染色体登陆获得含目标基因的阳性克隆。
6.外显子的分离、鉴定。阳性克隆中可能含有多个候选基因。用筛选cDNA文库,外是子捕捉和cDNA直选法等技术找到这些候选基因,再进行共分离,时空表达特点,同源性比较等分析确定目标基因。当然,最直接的证明是进行功能互补实验。
开放阅读框(Open Reading Frame, ORF)是基因序列中的一段无终止序列打断的碱基序列,可编码相应的蛋白。当一个新基因被识别,其DNA序列被解读,人们仍旧无法搞清相应的蛋白序列是什么。这是因为在没有其它信息的前提下,DNA序列可能按六种框架阅读和翻译(每条链三种,对应三种不同的起始位点)。ORF识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。
Super BSA(Super Bulk Segregate Analysis),超级集群分离分析法
生物信息学中用于QTL或基因定位的一类分析方法 BSA(分离体分组混合分析法或混合分组分析法,又称 集团分离分析法,Bulked Segregant Analysis)分析法首次由Michlmore等…提出并成功地在莴苣中筛选出与目的基因相连锁的标记。该方法首先从一对具有目标基因的表型差异的亲本所产生的任何一种分离群体中,根据目标基因的表型分别选取一定数量的植株,构成 2个亚群或集团。将每群的 DNA等量混合,形成两个相对性状 的“基因池”(gene pool),然后用合适的分子标记对两个基因池进行分析,在两群间表现多态性的分子标记遗传上与目标性状基因座位相连锁。在获得了与目标基因相连锁的分子标记以后,可以利用某一作图群体进行分析以便进一步检测所得分子标记与目标性状基因的连锁程度,以及其在某已知分子图谱中或染色体上的位置,这样才能完成真正意义上的对基因的标记定位。由于建池时使用了特定的分离群体,并且在分组时仅对目标性状进行选择,这样可以保证其他性状的遗传背景基本相同,两个基因池之间理论上就应主要在目标基因区段存在差异,因此两基因池又被称为近等基因池,这就排除了环境及人为因素的影响,使研究结果更为准确可靠¨。BSA法克服了很多作物难以得到近等基因系的限制,并且比近等基因系法省时省力,是一种非常实用的基因标记定位的方法,应用非常广泛。 可与BSA相结合用于基因定位的分子标记有多种,常用的分子标记有 RFLP(限制性片段长度多态性,Restriction Fragment Length Polymorphism),RAPD(随机扩增多态性 DNA,Random Amplified Polymorphism DNA),AFLP (扩增片段长度多态性,Amplified Fragment Length Polymorphism),SSR(简单重复序列,Simple Sequence Repeats)等。
RNA方向:单细胞转录组、链特异性建库、长链非编码、转录组GWAS、转录组BSA、转录组遗传进化等
DNA方向:突变体重测序,重测序GWAS、重测序BSA、重测序基因定位、重测序遗传进化等
微生物方向:宏基因组、微生物基因组、中小基因组、微生物多样性等 SLFA方向:基因定位、遗传进化、种质资源鉴定、BSA等
集群分离分析方法( bulk segregant analysis ,BSA)是快速有效地寻找与目的基因紧密连锁分子标记的经典方法,广泛应用于作物育种。将简化基因组测序SLAF-seq与传统BSA相结合的Super BSA,能更快速、准确、精细定位目标性状,具有混池规模大、标记密度高、数字化定量统计基因型频率等诸多优点。 应用领域
1. 1. 分子标记辅助育种(MAS); 2. 2. 基因克隆。 选材要求
1. 1. 有参考或无参考基因组序列的物种(二倍体、四倍体、六倍体物种均可);
2. 2. 具有重要农艺性状个体构建的遗传群体(临时群体:F1、F2;永久群体:RIL、DH、NIL 等);
3. 3. 混池个体最好不低于50(混池越大,越有利于消除背景噪音)。 测序方案
1. 1. Hiseq2500平台,PE125;
2. 2. 推荐每个个体标签平均深度≥1×,亲本标签平均深度≥20× 。

