免费学!三代宏基因组要点详解~
2022.04.19


宏基因组学以环境样品中的微生物群体基因组为研究对象,以功能基因筛选和测序分析为研究手段,以微生物群落多样性、组成、功能、相互协作关系及与环境之间的关系为研究目标。



宏基因组最大的优势在于不用分离培养也可获得细菌的基因组序列。二代宏基因组由于测序片段短限制了组装得到的contig长度,使得细菌的代谢通路、基因调控等研究只能基于群落水平。为了实现使用宏组学进行单菌基因组研究的目的,研究者开发了高通量分离培养、Binning等技术。今天就让小编带大家深入了解一下三代宏基因组相关的内容,小本本准备好~


Binning技术


宏基因组分箱(Binning)是将宏基因组组装得到的contigs按丰度变化模式和四核苷酸频率得到单菌基因组草图的过程,也可以使用reads或者gene进行分箱。Binning有助于获得不可培养微生物的基因组序列和功能。目前常用的软件有MetaBAT2、MaxBin,CONCOCT等,根据经验可总结出MetaBAT2组装结果整体最优,CONCOCT最快。


但由于微生物群落组成复杂,所以得到的bin不可避免有污染。所以在binning分箱后,需要结合其他软件,比如CheckM检查完整度和污染程度。


三代宏基因组


与二代宏基因组研究群落组成不一样的是,三代宏基因组更像“(宏)基因组”,也就是基于微生物群落数据,使用组装、分箱等技术实现群体微生物基因组草图的目的。


比如研究侧翼序列、基因水平转移、基因组共线性分析、功能互作、前噬菌体等,都需要contig ≥ 5000 bp的序列,而且需要有明确的分类信息。由于Binning受限于二代数据长度,所以单菌基因组的完整度和contig长度都有限。PacBio的HiFi测序技术通过提高文库片段长度,产生subread N50 ≥ 15 Kb,有效解决了contig长度短的问题,使得研究群落样品的单菌基因组草图成为可能。


三代宏基因组只能关注丰度最占优势的物种,越占优势的菌组装的基因组完整性越高。这是因为测序是随机的,每个片段被测到的概率符合泊松分布。有研究分析表明,如果基于PE150 reads水平分析一个简单群落的95%的序列,需要至少200 G数据量,如果考虑组装,那么原始的数据量将是海量的,即使测序成本hold住,目前的计算硬件也很难实现这么多序列的组装。


三代宏基因组并不是独立的,也可以与二代Binning分析结合,比如使用OPERA-LG对bin/MAG “搭骨架”,从而延伸contig/scaffold长度。


三代宏基因组分析内容


图1.png


图1 三代宏基因组信息分析流程


三代宏基因组组装质量


一般三代宏基因组构建15 Kb HiFi文库,由于酶读长超过60 Kb,甚至达到100 Kb,产出CCS N50约12 Kb,所以可以轻松达到4轮CCS校正,实现二代测序同等的碱基质量。并且由于基因组草图是基于序列组装得到的,比Binning更真实反应基因组实际情况。

 

表 1 CCS统计表


表一.png

 

安诺测试粪便样品,得到20个完整度高于97%的基因组草图!Nx图展示拼接完整度,横坐标Nx = 0.5即为contig N50,本样品contig N80约为3.3 Mb!


图2.png


图2 三代宏基因组拼接效果Nx图


三代宏基因组分析内容


二代宏基因组能做的分析三代也可以!那么三代宏基因组还能做什么呢?


Marker基因分布:

 

marker基因发布.png


基因组草图和Pan-Core基因分析[1]:

 

 

基因组草图和Pan-Core基因分析.jpg



基因组共线性分析:


基因组共线性分析.jpg


三代宏基因组送样要求




说了这么多,怎么送样呢?


样品浓度应满足≥20ng/μL,总量 ≥6µg,主带≥30kb,无RNA污染,DNA样本无颜色,主带集中无降解,不粘稠,无杂带,OD260/280在1.8-2.0,OD260/230在1.6-2.5,NC/QC在0.5-3.0。

 

随时欢迎在安诺公众号首页留下您的问题,我们的技术和销售会及时为您解答!



作为中国基因组行业的平台型企业,安诺优达拥有专业的测序服务平台,配备三代PacBio测序仪(2台Sequel IIe+7台Sequel II+10台Sequel),为您的科研之路保驾护航;成熟的生物信息分析流程,丰富的项目分析经验,让您的数据分析之途无忧。安诺优达已与中国农业大学、中科院遗传与发育所、中国海洋大学、中国农业科学院、福建农林大学等多家科研院所开展了深度合作,助力基因组文章发表于Cell、Nature、Nature Genetics、Nature Plants等多个国际高水平期刊。


参考文献:

[1] Peng M, Wang D, Lui LM, et, al. Genomic Features and Pervasive Negative Selection in Rhodanobacter Strains Isolated from Nitrate and Heavy Metal Contaminated Aquifer[J]. Microbiol Spectr. 2022 Feb 23;10(1):e0259121. doi: 10.1128/spectrum.02591-21.