GWAS研究怎么做,30000+paper来教你~
2018.04.20

快速发展的测序技术、迅速下降的测序成本以及处理大样本数据能力的提升都促进了全基因组关联分析(GWAS)的快速发展。相应文章也逐年增加,目前仅PubMed中收录的期刊就有31461篇(截止2018年3月18日)。GWAS都会做,可怎么才能做好呢?

1524453162250800.jpg

图1 GWAS文章数目

GWAS都会做,可怎么才能做好呢?小编一直在思考这个问题,今天小编查看了多篇SCI高分文章,并总结了安诺多个项目经验,最终发现大师级的GWAS文章通常由以下几部分组成。

Result 1:测序结果展示

自Circos图(图2)出现以来,许多人都选择它来展示测序数据。每一个切块代表一个染色体,每一层代表染色体的一类信息。另外它具有可个性化展示SNP密度、基因密度、基因组多样性、GC比例、染色体共线性等优点,因而备受广大科研工作者的追捧。

1524453187833016.jpg

图2 Circos效果图

Result 2:群体结构展示

群体结构以系统进化树(图3a)、主成分分析(图3b)和Structure图(图3c)组成,不仅是paper里的颜值担当,更是展示群体结构的实力担当。系统进化树用来呈现样本差异度远近,通常结合取样的地理、环境等因素效果更好(图4)。这里推荐大家用PHLIP软件的NJ法构建进化树,结果再用Newick Utils软件进行图形美化效果更好。群体分群及亚群进化关系可以用主成分分析来展示;而群体间基因交流情况以及个体混杂程度情况等则需要用Structure图展示。这里分别推荐使用linux系统下的EIGENSOFT软件和Admixture 软件进行主成分分析和群体结构分析。三者结合群体结构一目了然。

1524453207799362.jpg

图3 群体结构三要素分析


1524453231603459.jpg图4 系统进化树结合地理因素展示图

Result 3:关联分析

GWAS之所以能够挤进高分区的关键就在于它在数据挖掘方面的优势。传统的图位克隆(图5)受限于标记数目和密度对一个表型相关基因的定位速度慢、见效时间长,要想拿到最终基因通常要经过实验室里“好几代”人的努力。

GWAS却不同,高通量测序得到的全基因组水平的多态性数目之多(107-109),远超手工筛选的差异标记(104以内)和芯片的筛选到的SNP数目(106以内)。用曼哈顿图将全基因组水平SNP与性状相关性的P value,超出阈值的位点就是我们关心的位点。


5.jpg图5 关联分析结果展示

Result 4:基因挖掘及功能验证

表型关联基因组多态性可以轻易找到我候选区域。为了进一步缩小这个区间需要曼哈顿图和LD Block图结合使用(图6)。如果目标位点是主效位点,那这个区间内的基因就极有可能是目标候选基因。对候选基因开展研究可通过GO和KEGG注释等对功能注释预测,而后续的基因功能验证和表型互补有了以上基础也会更简单!

1524453267393022.jpg

图6 曼哈顿图和LD Block图联合分析

注:根据曼哈顿图找到关联性最高的区域,这个区域对应的染色体位置和这个位置的LD Block图可以看出这里面包含三个候选基因,说明这3个编码基因都可能是潜在的候选基因。

看完之后感觉怎么样?是不是后悔现在才发现GWAS研究的“真面目”,不过一切都不晚呦~

安诺优势

01、全面的测序平台

国内最强大的测序平台之一,囊括目前市场上的各种测序平台。

1524453295490912.jpg


02、动植物重测极速体验

重测序极速周期,最快仅需8个自然日就可以拿到数据。

03、自动化平台

拥有高通量的自动化建库,涵盖个体重测序、群体进化、GWAS等各个方向。

1524453311879480.jpg

04、众多项目经验

多年重测序测序服务经验,积累了丰富的项目经验,成熟专业的生信团队可快速的为您定制方案。

1524453324648613.jpg

参考文献

Fang C, Ma Y, Wu S, et al. Genome-wide association studies dissect the genetic networks underlying agronomical traits in soybean[J].Genome Biology. 201718:161.

Lei F, Wang Q, Yan H, et al. Genomic analyses in cotton identify signatures of selection and loci associated with fiber quality and yield traits[J]. Nature.Genetics. 2017 49:1089.

Mace ES, Tai S, Gilding EK, et al. Whole-genome sequencing reveals untapped genetic potential in Africa’s indigenous cereal crop sorghum[J]. Nature. Communication.2013, 4:2320.

Zhang Z, Liu Z, Hu Y, et al. QTL analysis of Kernel-related traits in maizeusing an immortalized F2 population[J]. Plos One. 2014 9:e89645.


文案: 动植物产品经理 杨军波

设计:胡珊珊


在线客服

>>

安诺基因在线客服

客服1 客服2 客服3

电话:400-8986-980