又快又好的真菌基因组组装,不容错过
2018.04.02

真菌基因组组装

在自然界中,真菌种类非常庞大,多达百万种,光记录在册的就有数万种,但已有报导的真菌基因组只有几十种,大部分真菌都缺少参考基因组。PacBio三代测序技术自问世以来,便掀起了一股基因组组装的热潮,与Gb级的基因组组装所需较大数据量相比,小型的真菌基因组测序需要较少的数据量就足以满足组装的需求,可谓是性价比极高。安诺基因从2016年起就开始研发搭建适用于三代测序数据的真菌基因组组装流程,期间进行了多次优化升级,目前已经成功完成了多个项目的三代真菌基因组组装,小编在此跟大家分享一下安诺基因最新组装的项目数据。

测序策略

材料:某食用菌菌丝体样本

基因组大小:预估在40Mb-50Mb之间

测序平台:构建20kb DNA文库,PacBio Sequel测序1个SMRT cell

数据产出统计

对测序下机的数据进行了初步质控分析后,获得了6.2Gb的合格数据用于后续组装分析,其中subreads平均读长为8.4kb,subreads N50为14.4kb。

1522633367701913.jpg

基因组组装情况

对质控后6.2Gb的subreads进行纯三代组装,先利用纯三代组装软件 Canu和MECAT分别进行组装,然后利用Quickmerge再次进行组装优化,提升组装结果。

Canu组装结果统计

通过使用 Canu组装,最终得到基因组大小49Mb,Contig N50为2.1Mb,Contig Number为58,详细结果见表1:

表1 Canu组装结果数据统计

1522633383485107.png


MECAT组装结果统计

又快又好的真菌基因组组装,不容错过

通过使用 MECAT组装,最终得到基因组大小48Mb,Contig N50为1.7Mb,Contig Number为63。详细结果见表2:

表2 MECAT组装结果数据统计

1522633395139400.png

最后使用 Quickmerge进行组装并对组装结果做进一步优化,最终得到的基因组大小为50Mb,Contig N50为3.08Mb,Contig Number为31,详细结果见表3:

表3 优化后的组装结果统计

1522633409317399.png

基因组组装评估

对组装后的结果进一步做BUSCO评估,评估基因组组装、基因集和转录本的准确性和完整性,BUSCO评估结果显示Complete BUSCOs 比例为95%,可以看出本次基因组组装的完整性是非常高的。

总结

该食用菌项目进行了1个SMRT Cell测序,得到约120X的数据量,组装得到基因组为50Mb,总计获得31条Contigs,Contig N50>3Mb。

安诺真菌基因组项目优势

1522633421580697.jpg

文案:三代产品经理 辛颖

设计:胡珊珊


在线客服

>>

安诺基因在线客服

客服1 客服2 客服3

电话:400-8986-980