4008-986-980
CN| EN

首页 > 新闻中心  > 公司新闻

进阶|染色体水平的单体型基因组组装最新策略大放送

2018-07-12

为什么我提供的材料是二倍体或多倍体,最后分析提供的最好组装序列信息为n条基因组的,难道不应该是组装到2n(n为配子的染色体条数)?这是个经常被问到的问题,有些是出于不完全清楚现在基因组组装现状而问,有些则是出于深入阐释与杂交、杂种优势、多倍体组装等相关的问题考虑。但是不管是哪个原因,单体型基因组组装都是基因组学研究的发展愿景和极致追求。


举个例子.png


举个栗子,类似于玩一套双胞胎(或多胞胎)人像的拼图,如果我们想要知道双胞胎(或多胞胎)大概长什么样,我们只需要拼出其中一个的图像就可以。但在这个过程中我们可能把另外一个双胞胎的拼块用在拼这个图像,虽然拼块用错了这个拼出来的图像也不会有太大差别,但这个游戏有个前提,就是这两个双胞胎长得几乎完全一致,那要是这对双胞胎是龙凤胎呢?或者是异卵双胞胎呢?这样你还只能通过拼接其中的一个来判断他们的外貌么?显然这时的信息是不够的,最好的办法是有显著线索用于区别两者之间的差别,把两幅人像全部组装起来。


q l.jpg


单体型基因组组装其实就是对于二倍体或者是多倍体,将两个配子来源的染色体进行分别组装。


目前在选择样本的过程中多选择重组自交系样本、亲缘关系比较近的种内杂交产生的样本材料,主要的顾虑就是为了避免材料高杂合带来的组装困难的情况(即可以理解为这双胞胎或者多胞胎长的越像越好,长得越像,就只用拼出其中一个就好)。但是随着研发需求的增加,出现了越来越多的更具针对性的组装方案,比如纯二代组装、高深度二代组装加上低深度三代补Gap、纯三代组装、Bionano提升组装连续性、Hi-C辅助组装等多种组装策略。可即便如此,依然缺少好的单体型组装策略,之前的单体型区块组装策略没有很好地解决全染色体范围内的单条染色体长度的单体型基因组组装问题。


2.png


如上图所示,我们在做基因组组装的时候希望得到的C图的状态,即染色体水平的单体型基因组组装;实际上现在组装得到的A图的存在高杂合区域状态,理想状态是经过组装得到再经过去冗余之后得到的B图的组装状态。


那么问题是如何得到C图所展示的组装结果?


在这里不得不提的一个技术就是FALCON-PHASE,单体型基因组组装的新技术。


其主要的技术原理示意图如下:


3.png


其主要流程包含:

1. 鉴定:识别基础组装的contig中组装出的单体型区块;

2. 拆分:将contig按照可拆分单体型的基因组区域和不可拆分单体型的基因组区域进行拆分断;

3. 比对:将Hi-C reads比对到打断后的contig上,构建标准化的互作矩阵;

4. 挂载:经过Hi-C辅助组装挂载获得单条染色体长度的单体型基因组组装。


测序策略:

1. 适当覆盖度的父母本高质量二代数据(Illumina ≥30X),用于鉴定亲本特异性来源的K-mers,在子代中分开两个单体型;

2. 子代中足够覆盖每个单体型基因组的长读长测序数据(Pacbio ≥80X,每组染色体的覆盖度≥40X),用于组装单体型基因组。


组装结果展示:

为了测试该组装流程的单体型组装效果,文中作者分别在拟南芥、人和牛三个物种中进行了单体型组装分析。具体结果展示如下:


4.png


从上表结果来看,该方法是一个有效组装单体型基因组的方法。且该策略对于高杂合的样本尤其适用,例如在组装牛的基因组过程中,组装单体型基因组的材料是Bos taurus taurusBos taurus indicus杂交得到的F1代,其单体型基因组组装后得到的每个单体型的基因组NG50 ≥20 Mb,且精度高达99.998%,远超于现有的牛的参考基因组。


目前,安诺基因已经完成了该流程的测试,亲试有效~故正式“吱”一声,安诺可以针对高杂合的二倍体、多倍体的单体型基因组组装了~一起来尝鲜吧~


  • 关注我们
  • 安诺基因
  • 医学健康

  • www.annoroad.com

网站地图 隐私说明 使用条款 联系我们

Copyright2012 genome.cn 安诺优达 版权所有

All rights reserved Annoroad JICP备12029022号-4

进阶|染色体水平的单体型基因组组装最新策略大放送-公司新闻-新闻中心-安诺优达
展开