本氏烟草(Nicotiana benthamiana)为一年生茄科烟草属植物,由于其快速的瞬时转基因分析,是一种广泛应用于植物生物学和生物技术中的模式植物。2024年11月14日,北京大学现代农业研究院郭立团队在Nature Plants上发表了题为“The complete genome assembly of Nicotiana benthamiana reveals genetic and epigenetic landscape of centromeres”的研究论文,本研究组装了一个端到端完整的多倍体T2T植物基因组,同时对异源四倍体本氏烟草的着丝粒序列及其表观特征进行了深入解析。北京大学现代农业研究院郭立研究员为论文通讯作者,陈为凯副研究员为论文第一作者。北京大学现代农业研究院科研助理陈绍英、孙杰、王靖萱、孟点等人参与该研究。安诺优达为该项目提供三代建库测序服务。
研究背景本氏烟草(Nicotiana benthamiana)作为一种在植物生物学和生物技术领域广泛应用的模式生物,基因组研究对于揭示其生物学特性和进化历史具有重要意义。尽管先前的研究已对该基因组有所探索,但完整的基因组序列,尤其是着丝粒和端粒区域,仍未被完全解析。本氏烟草属于异源四倍体,包含两个亚基因组,研究其亚基因组和潜在的二倍体祖先,有助于揭示物种分化、杂交事件和基因组重排等演化过程。因此利用长读长测序技术,如PacBio HiFi和Oxford Nanopore Technology(ONT)等解析多倍体烟草的基因组结构,同时对着丝粒、端粒序列进行探究将是一个有效的研究模型。
研究结果
高质量T2T本式烟草基因组组装
研究人员采用多种先进测序技术实现了本式烟草(Nicotiana benthamiana)高质量的端到端(T2T)基因组组装,包括PacBio HiFi测序(116.7×覆盖度)、ONT超长测序(47.9×覆盖度)、Illumina短读测序(100×覆盖度)、Hi-C染色质互作数据(150×覆盖度)以及Bionano光学图谱(329.6×覆盖度)。最终组装的基因组总长为2.849 Gb,共19条染色体,Contig N50达146.41 Mb,同时研究人员对该基因组的38个端粒和19个着丝粒区域进行了完整解析。质量评估显示基因组具有98.8%的完整BUSCO基因、QV值为69.63、LTR评分为17.84,且光学图谱和Hi-C验证均证明其具有出色的连贯性和准确性。
图 本式烟草T2T基因组图谱构建
异源四倍体亚基因组的定位
研究人员通过差异性k-mer分析、主成分分析(PCA)和基因组共线性分析,对本式烟草(Nicotiana benthamiana)异源四倍体的亚基因组进行了精确划分,并结合系统发育树与基因组比对深入溯源其祖先来源。研究发现,19条染色体可分为SubA(11条)和SubB(9条)两个亚基因组,其中SubA来源于N. glauca和N. attenuata的姐妹类群(母系),而SubB来源于N. sylvestris的姐妹类群(父系)。亚基因组分析揭示了广泛的染色体重组和基因丢失现象。通过多方法验证,该结果清晰揭示了本式烟草亚基因组的划分与起源,为异源四倍体基因组的进化研究提供了重要依据。
图 异源四倍体亚基因组定位
着丝粒和着丝粒卫星DNA的特征研究
研究人员系统解析了本式烟草(Nicotiana benthamiana)19个完整着丝粒的遗传与表观遗传情况,发现其分为三种主要类型:卫星型、Gypsy型和NUMTs型,并通过CENH3 ChIP-seq分析、重复序列注释与表观遗传特征研究揭示其不同的功能特性。卫星型着丝粒以核糖体DNA(45S和5S rDNA)片段为来源,通过串联扩展形成功能性卫星DNA,并伴随转座元件侵入,逐步演化为成熟着丝粒;而Gypsy型着丝粒则以Ty3/Gypsy转座元件为主。研究还发现卫星型着丝粒富集H3K4me3修饰,而Gypsy型缺乏显著表观遗传标记,DNA甲基化模式也存在差异。这些结果揭示了本式烟草着丝粒的多样性及其卫星DNA的起源与演化机制。
图 着丝粒卫星DNA特征研究
本式烟草着丝粒的遗传特性及进化机制
研究人员通过对着丝粒线粒体DNA(NUMTs)分布分析、CENH3 ChIP-seq精准定位和进化比较,系统揭示了本式烟草着丝粒的遗传特性及进化机制。研究发现,NUMTs显著聚集于母系亚基因组(SubA)的着丝粒区域,共识别出113个NUMTs,其中81个位于功能性着丝粒附近区域,部分直接成为CENH3结合位点,构成功能性核心。通过对19个着丝粒的表观遗传和成分分析,明确了Gypsy型和卫星型着丝粒的主要组成及差异,其中Gypsy型以CRM和Tekay转座元件为主,卫星型则通过CEN33和CEN43等核糖体DNA衍生的卫星序列扩展形成。研究提出了着丝粒从“新生着丝粒”到“成熟着丝粒”的演化模型,卫星DNA的扩展和转座元件侵入是关键驱动因素,而混合型着丝粒可能是这一过程的中间状态。
本式烟草的进化史
研究人员发现,在大约2300至4400万年前,烟草属(Nicotiana)和茄属(Solanum)物种经历了一次共同的全基因组三倍化事件后开始分化。此后,在600万至1000万年前,烟草属内的Sylvestres和Noctiflorae/Petunioides两个分支发生了分化。大约500至600万年前的上新世过渡期,Suaveolentes(包括本氏烟草)通过一次杂交事件形成。异源四倍体本氏烟草的基因组在形成后经历了大规模的重排和重组,称为“基因组冲击”事件,随后的长期基因组二倍化过程导致了染色体的分裂和融合,卫星序列的出现,以及新着丝粒的形成等事件,从而塑造了本氏烟草的现代基因组。
图 本式烟草基因组染色体进化历史
研究人员利用PacBio HiFi和Oxford Nanopore Technology(ONT)长读长测序技术,成功组装并注释了本氏烟草(Nicotiana benthamiana)的完整2.85 Gb基因组,涵盖了所有19条染色体的端到端序列。研究揭示了本氏烟草着丝粒的遗传和表观遗传特征,发现其着丝粒既有基于卫星序列的,也有富含Ty3/Gypsy逆转录转座子的,提出了新着丝粒形成和卫星序列扩张的演化模型。此外,通过亚基因组分析确定了本氏烟草的两个亚基因组,并推断了其潜在的二倍体近缘祖先,重建了其基因组演化历史,包括全基因组三倍化事件、物种分化、杂交事件以及基因组冲击后的演化过程,为理解这一模式生物和多倍体植物基因组演化提供了宝贵的资源和新见解。
参考文献
Chen, W., Yan, M., Chen, S.et al. The complete genome assembly of Nicotiana benthamiana reveals the genetic and epigenetic landscape of centromeres. Nat. Plants (2024). https://doi.org/10.1038/s41477-024-01849-y