全基因组关联分析

  • 产品简介
  • 技术流程
  • 样本要求
  • 案例分析
  • FAQ

全基因组关联分析 (Genome-Wide Association Study,GWAS)在动植物的研究中对于重要性状特别是复杂形状的定位有着快速、高效、准确的优点。基于高通量测序对某种农作物或禽畜的代表性品种、地方种或野生种进行基因分型,结合准确的表型数据可对农作物或禽畜重要复杂性性状进行定位。特别是在包含了野生种、驯化种和改良种的群体中,结合群体进化分析对收到驯化和改良的重要基因进行定位,是研究作物或禽畜微进化及驯化改良表型的重要思路。

产品优势
  • 个性化定制分析
    升级的信息分析流程,高级分析和个性化分析全程无忧
  • 定位有效
    高通量检测全基因组SNP并关联表型,扫除定位“盲点”
  • 准确度高
    重筛选SNP,多重检验显著性,确保结果准确可靠
应用领域
  • 动植物复杂性状定位

7、全基因组关联分析.png


产品类型测序策略指 标周 期
GWAS

NovaSeq 600

0

MGI DNBSEQ-T7

样本数≥200;
测序深度≥5X个体
分析周期45天(400个样本以内、 5Tb 数据量以下)

产品类型送样要求
GWAS样品类型:基因组DNA样品;
样品需求量:小片段文库≥0.2μg;
样品浓度:≥5ng/μl;
样品纯度:OD260/280= 1.8~2.2;OD260/230=0.8-2.5;
样品质量:基因组完整,DNA主带清晰、无降解、无污染。

全基因组关联分析快速定位影响水稻农艺性状的新基因
Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice
期 刊:Nature Genetics     发表时间:2016.06     发表单位:日本名古屋大学      影响因子:29.352
研究背景

对于鉴定未知基因与 QTL 的关联存在较大困难的原因在于:1、具有丰富多态性的作物群体材料常常存在强烈的群体结构效应,进而导致表型与分子标记之间的假阳性关联结果。2、LD 衰减距离过长导致未知基因鉴定困难,特别是当单个LD 衰减范围内存在多个候选基因表现出显著信号时,对于与目标基因关联的真实基因需要通过额外的实验进行确认。

研究思路

材料:选取了没有较高群体结构、彼此之间有一定血缘关系的176日本粳稻品种,同时群体又表现出很高的群体多态性

建库:DNA小片段文库

测序:Illumina HiSeq2000,PE100,5.8X

分析:群体结构分析,LD分析,关联分析

研究结果

群体表型鉴定


选择表型呈正太分布且组间存在丰富的差异的材料;基于样本间SNPs多态性的群体结构分析则表明在这些表型差异丰富的材料之间不存在明显的群体分层。群体的 LD 衰减物理距离在445kb(r2 = 0.2),与已报道的具有更高表型多态性的群体相比,LD 衰减比较一致,说明材料的选择对控制 LD 衰减有一定的帮助。

1.png
图1 群体表型数据统计与主成分分析


GWAS快速鉴定性状关联基因及验证


文章通过使用混合线性模型进行 GWAS 关联分析,鉴定到了26 个LOD 值大于4.77 的位点,其中有 3个最高的信号位点分别位于染色体 1,6,11,两个峰点的位置与已报道的抽穗期相关基因Hd6 和Hd2的QTL 定位结果一致,分别定位与染色体3 和染色体7。对于GWAS 定位结果的验证,采用已报道的 QTL 来验证是最具说服力的。

2.png
图2 与水稻拔节相关的QTL定位结果


新基因的鉴定


对于未经报道的QTL定位信号,其中位于染色体 1 的候选区域被锚定在36.30Mb 到36.65Mb之间(346kb),该候选区域包括了91个与抽穗期显著关联的位点和7个基因,其中基因LOC_Os01g62780与拟南芥的HESO1基因同源,该基因在拟南芥中表现为延迟开花。同样,位于第11号染色体上也挖掘到了与水稻抽穗期相关的候选基因LOC_Os11g08410。研究者也对水稻的分蘖数、叶宽等性状进行了全基因组关联分析,获得了许多控制上述农艺性状的候选基因。

研究结论

为保证GWAS 分析结果的准确性,文章在材料选择方面选择了群体结构分层不明显的水稻材料。基于基因的关联分析对农艺性状 GWAS 分析检测的假阳性结果有很好控制效果。

参考文献

Yano K, Yamamoto E, Aya K, et al. Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice[J]. Nature Genetics, 2016.


  • Q:连锁分析与关联分析(GWAS)有什么差异?
    A:
    连锁分析和关联分析在数量性状研究上都具有重要作用,但是二者在QTL定位的精度、广度方面存在区别:连锁一般找到的是某个区域;关联找到的是某个点。连锁结果相对准确,假阳性小,但精细定位很困难,主要原因是因为重组代数有限,很多基因没有打破连锁;关联相对粗糙,假阳性高,但可以直接定到基因位点。

  • Q:群体进化研究和GWAS研究的取材区别?
    A:
    做群体进化要求选材具有明确的分类,每个亚群中的样本具有代表性和多态性。GWAS研究结构受群体结构影响比较大,所以选材要尽量控制群体结构,如样品间没有明显的亚群分化;样本具有广泛的代表性,彼此间存在着丰富的多态性。

  • Q:GWAS有哪些研究策略?
    A:
    (1)复杂性状定位到单基因水平,获得目标性状相关的功能标记;
    (2)GWAS和群体进化结合,对控制目标性状的候选基因进行精准定位;
    (3)GWAS和QTL互补定位目标性状的候选基因;
    (4)与转录组联合分析进行性状定位和转录水平的微进化分析;
    (5)与Hi-C联合分析进行性状定位、非基因编码区的功能分析以及突变引起性状改变的机制解析。