岁末再添新禧|Hi-C辅助组装项目合作文章见刊Nature Communications
2019.01.30

临近新岁,再添新禧。2019年1月25日,中国农业大学赖锦盛教授团队与安诺基因合作的研究成果《Chromosome conformation capture resolved near complete genome assembly of broomcorn millet》[1]见刊于Nature Communications(IF=12.353)


研究利用单分子实时测序技术(PacBio)、光学图谱技术(BioNano)及Hi-C辅助组装技术对优质糜子材料陇糜4号基因组进行组装,获得基因组大小为848.4 Mb,scaffold N50为8.24 Mb。通过Hi-C辅助组装,将98.9%的基因组序列锚定到18条pseudomolecules上,获得了高质量染色体水平参考基因组。高质量的糜子基因组序列不仅为糜子的遗传改良奠定坚实的基础,也为柳枝稷等其他重要黍族作物的比较基因组学和遗传改良提供重要帮助。安诺优达生物信息研发主管占伟作为共同作者,承担了该研究中Hi-C辅助组装分析工作。


图1 糜子高质量参考基因组在线发表

图1 糜子高质量参考基因组在线发表



研究背景


糜子可能是世界上最古老的农作物之一,最早的栽培可追溯到大约距今1万年的中国北方。也有考古证据表明另一个起源中心可能是东欧,最早的栽培发生在距今约7千年。糜子是一种近期形成的异源四倍体物种,其两个亚基因组来源于P.capillareP.repens。由于其生长季短,需水量极低、耐盐性高、营养资源利用效率高等特点,可作为边远地区种植的先锋作物。最近发表的一份糜子的基因组草图,虽然证实10X组装高度复杂的作物基因组的可能性[2],但在黍属中仍没有高质量的参考基因组发表,因此通过多技术联合组装策略获得高质量参考基因组是非常必要的。



实验材料


陇糜4号



测序策略


表1 糜子基因组测序策略统计表

表1 糜子基因组测序策略统计表



研究结果


01 高质量染色体水平糜子基因组组装


利用K-mer分析对糜子的基因组进行预估,预估基因组大小为887.8 Mb,约为谷子基因组(485 Mb)的两倍,与之前的假设保持一致,即糜子在与Setaria分化后,发生了四倍体化事件。此外,糜子和同属的柳枝稷在基因组大小上具有显著的差异,推测二者发生了独立的多倍化事件。基于PacBio和BioNano数据,最终组装的基因组大小为848.4 Mb,scaffold N50为8.24 Mb。为评估组装质量,将全基因组测序及RNA-seq的数据与基因组进行比对,比对率分别是99.6%和91.5%,同时BUSCO评估完整性为98.0%,证明了基因组组装的高完整性和准确性。


表2 糜子基因组组装和基因注释数据统计表

表2 糜子基因组组装和基因注释数据统计表


为进一步将基因组组装提升至super scaffold水平,利用140.2 X的Hi-C数据进行挂载,最终将98.9%的基因组序列聚类并定向到18条pseudomolecules,N50为48.3 Mb,接近单条染色体的长度,获得了高质量的近染色体水平的参考基因组。


通过基因注释,共预测出63,671个基因,约为谷子基因数量(34,584个)的两倍。二者同源性分析发现,谷子中19,609个基因至少在糜子中一个亚基因组中存在同源,其中86.2%的基因在糜子中保留了两个同源拷贝,该结果与玉米和大豆中WGD事件后基因急剧丢失形成了鲜明对比,暗示了糜子的WGD事件晚于大豆和玉米。


图2 陇糜4号 Hi-C辅助组装后的pseudomolecules 结果展示

图2 陇糜4号 Hi-C辅助组装后的pseudomolecules 结果展示


为揭示基因家族的特异性扩张,对糜子、高粱、谷子、玉米和珍珠稷进行聚类分析,在共有基因家族中,糜子的基因数量要高于谷子和珍珠稷。由于WGD事件,造成糜子中的特有基因家族和基因数量最多。对糜子特有基因进行功能注释,主要功能涉及Cytochrome P450、NB-ARC结构域、糖转运体和细胞壁相关受体激酶等。通过对糜子基因的深入挖掘,鉴定了493个NB-ARC结构域和15个ABA或WDS响应基因,这些基因分别与糜子抗病性和耐旱性相关,为后续培育抗生物胁迫和非生物胁迫的糜子品系奠定研究基础。


图3 不同物种基因组家族韦恩图

图3 不同物种基因组家族韦恩图


02 黍族系统发育


研究利用糜子高质量参考基因组与新发表的珍珠稷和Dichanthelium oligosanthe联合分析,重建了黍族系统发育树。通过计算Ks、同源基因对的同义替换率及峰值推断糜子和谷子于1300万年前发生分化,略早于高粱和玉米的分化时间(1190万年前)。系统发育树显示三个植物的峰值几乎共线,说明它们分化时间十分接近。谷子和珍珠稷分化较晚,分化时间为981万年前,略早于推测时间(830万年前)。通过谷子与高粱及糜子与高粱间的Ks分析,证明高粱族和黍族具有共同的祖先,推测糜子异源四倍体的形成时间近于591万年。


图4 黍族系统发育

图4 黍族系统发育


03 研究结论


该研究通过PacBio、BioNano光学图谱及Hi-C对糜子进行测序和基因组混装,获得了糜子高质量的参考基因组,最终组装的基因组大小为848.4 Mb,scaffold N50为8.24 Mb。通过Hi-C辅助组装,将98.9%的基因组序列锚定到18条糜子染色体上。共计注释到63,671个蛋白编码基因,并且发现糜子中大约86%与谷子共线性的基因在糜子中都保留了两个拷贝。系统发育分析表明,糜子和谷子在1300万年前发生了分化,同时糜子的四倍体化发生在591万年内。糜子高质量参考基因组的发表,有利于糜子基因组辅助育种,为其他物种的研究提供了重要资源。


安诺优达作为国内高质量染色体水平参考基因组优质提供商,配备了包含Oxford Nanopore PromethION、PacBio Sequel、Illumina HiSeq X Ten、NovaSeq 6000等全面的高通量测序平台,用于获得高质量的序列信息。高水平的分析团队根据基因组特征,选择合适软件(canu、falcon、wtdbg、mecat等)进行单独或混合组装,可将常见基因组组装至Mb级别,通过Hi-C辅助组装,将基因组草图组装至染色体水平。至2018年底已积累100+基因组组装项目经验,涉及林木、草本、中草药、农作物、哺乳动物、昆虫、真菌等各个方向,部分相关研究成果已发表于Nature GeneticsMolecular PlantNature Communications等国际高水平期刊,累计IF达117.487。在即将到来的2019年,安诺基因会给大家带来更多的高质量基因组组装成果。


参考文献:

[1] Junpeng Shi, Xuxu Ma, Jihong Zhang, et al. Chromosome conformation capture resolved near complete genome assembly of broomcorn millet[J]. Nature Communications, 2019.

[2] Ott, A. et al. Linked read technology for assembling large complex and polyploid genomes[J]. BMC Genom. 19, 651 (2018).


在线客服

>>

安诺基因在线客服

客服1 客服2 客服3

电话:400-8986-980