4008-986-980
CN| EN

首页 > 新闻中心  > 成果展示

动植物重测序研究秘笈之:如何利用GWAS定位复杂性状

2016-10-31

工欲善其事必先利其器,好的研究思路可能是一个厚积薄发的灵感乍现,也可能是站在前人肩膀上的提炼升华,更有可能是不同领域的激情碰撞。能够为大家做好一块动植物重测序的敲门砖,抛砖引玉,让大家好思路不断,是小编的荣幸。


小编将持续为大家带来重测序的不同研究策略,今天我们从GWAS启程!从本篇“功夫秘笈”开始,小编将连续推出动植物重测序研究策略分享系列文章。


GWAS技术简介


基于对遗传多样性丰富的自然群体中的个体进行全基因组重测序,结合准确的目标性状的表型数据及统计方法进行全基因组关联分析,可对动植物复杂性状进行定位,快速获得影响目标性状表型变异的遗传标记或候选基因。

研究思路

研究思路.jpg

研究策略


样本量

动植物自然群体:经济作物、哺乳动物、家禽家畜、林木种质资源等。 

自然群体大小:至少200个样品,选取的个体有代表性。样本间不能有明显的群体结构(比如出现生殖隔离),同时,样本间有丰富的表型。


测序策略

基于全基因组低深度重测序的GWAS研究:全基因组重测序,每个样本>5X测序深度,少量样品测序深度建议>10X, Illumina HiSeq,PE150。


下面我们通过两个经典案例来具体学习GWAS的研究策略。


案例解析

基于全基因组重测序的全基因组关联分析快速定位影响水稻农艺性状的新基因


样品选取

176个日本粳稻品种,样品间没有较高群体结构、彼此之间有一定亲缘关系的粳稻家系群体,同时群体又表现出很高的表型多态性。


测序策略

Illumina HiSeq,PE100,每个样品平均约4.8X全基因组重测序。


分析结果

1. 表型统计、群体遗传多样性分析

图2 GWAS分析1号染色体上抽穗期关联基因.jpg

图1 日本水稻的表型多样性和遗传结构


选材主要依据:一、从系谱信息可以得知选择的176个日本稻彼此有遗传关联,且从图1e的PCA分析可看到整个选择的群体比较聚集,表明不是一个高结构化的群体;二、 从图1a-d的农艺性状相关的表型分析(抽穗期、植株高度、圆锥花序的长度以及叶宽)表明该群体包含了多种农艺性状相关的QTLs。


2. GWAS验证


文章使用混合线性模型进行GWAS关联分析,鉴定到了与抽穗期相关的26个LOD值大于4.77的位点,其中有3个最高的信号位点分别位于染色体1,6,11,两个峰点的位置与已报道的抽穗期相关基因Hd6Hd2的QTL定位结果一致,分别定位与染色体3和染色体7。对于GWAS定位结果的验证,采用已报道的QTL来验证是最具说服力的。

图2 GWAS分析1号染色体上抽穗期关联基因.png

图2 GWAS分析1号染色体上抽穗期关联基因


对于未经报道的QTL定位信号,其中位于1号染色体的候选区域被锚定在36.30Mb到36.65Mb之间(346Kb),该候选区域包括了91个与抽穗期显著关联的位点,其中8个I型(显著关联性状,内含子起始或结束位点的氨基酸突变或剪切位点突变)位点分布于7个基因上,其中基因LOC_Os01g62780与拟南芥的HESO1基因同源,该基因在拟南芥中表现为延迟开花(图2),分析发现主要是328位的缬氨酸突变为异亮氨酸形成了两种单倍型,含有单倍型A的品种表现为抽穗时间早于单倍型B的品种。两年的样本表型数据统计分析以及功能获得性验证得到的结果则验证了该位点的功能。


同样,在第11号染色体上也挖掘到与水稻抽穗期相关的候选基因LOC_Os11g08410。此外,研究者也对水稻的分蘖数、叶宽等性状进行全基因组关联分析,获得许多控制上述农艺性状的候选基因。

作者建议GWAS分析的一般流程

(1)通过单个核苷酸多态性关联分析检测显著关联信号;

(2)基于LD确定显著信号的候选区域;

(3)基于功能多态性和功能注释筛选目的基因;

(4)将功能获得性的表型转化至功能缺失表型的植株中,鉴定(2)中筛选的基因。


文章对作物GWAS分析总结

A、为保证GWAS分析结果的准确性,文章在材料选择方面选择了群体结构分层不明显的水稻材料。

B、基于基因的关联分析对农艺性状GWAS分析检测的假阳性结果有很好控制效果。



全基因组重测序结合GWAS定位公牛重要经济性状


样品选取

荷斯坦牛、来弗威赫牛和娟珊牛,三个品种中232头公牛和2头母牛


测序策略

 Illumina,每个样品平均约8.3X全基因组重测序。


分析结果

牛作为肉源、奶源、劳力,已被长久驯化,如今健康、营养成分指标已经作为育种产业重要关注性状。通过GWAS分析定位到与胚胎死亡、骨骼畸形、产奶能力以及毛发卷曲相关的关键基因,让健康牛的选择成为可能。下图1则展示的是牛乳汁脂肪含量性状的关联分析。


对3513头弗莱维赫牛(图3a)和2327头荷斯坦牛(图3b)进行乳汁中脂肪含量性状进行关联分析,获得了6个未报道的QTL位点与该性状相关,其中有两个位点位于DGAT1基因附近。研究发现DGAT1基因对牛的牛奶产量性状有很大影响(图3)。


图3 牛乳汁脂肪含量形状的关联分析.png

图3 牛乳汁脂肪含量形状的关联分析


安诺基因GWAS产品优势

1、 标记密度高,无需构建作图群体,自然群体/种质资源都可作为研究材料;

2、 可以一次性同时考察多个性状,目标性状关联基因定位到单基因水平;

3、 数据可重复利用 ,也可以和群体进化或者QTL-seq联合分析,精准定位;

4、重重筛选SNP,多重检验显著性,扫除定位“盲点”,确保结果准确可靠。

参考文献


[1] Yano K, Yamamoto E, Aya K, et al. Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice[J]. Nature Genetics, 2016.

[2] Daetwyler H D, Capitan A, Pausch H, et al. Whole-genome sequencing of 234 bulls facilitates mapping of monogenic and complex traits in cattle[J]. Nature Genetics, 2014, 46(8): 858-865.

  • 关注我们
  • 安诺基因
  • 医学健康

  • www.annoroad.com

网站地图 隐私说明 使用条款 联系我们

Copyright2012 genome.cn 安诺优达 版权所有

All rights reserved Annoroad JICP备12029022号-4

动植物重测序研究秘笈之:如何利用GWAS定位复杂性状-成果展示-新闻中心-安诺优达
展开