4008-986-980
CN| EN

首页 > 新闻中心  > 成果展示

Hi-C信息分析,你的数据量够了吗?

2018-05-23

对于Hi-C互作分析而言,不同分辨率水平可以分析不同的结构特征,其中,分析A/B compartment结构需要的分辨率在100kb,分析TAD结构需要的分辨率在40kb,分析loop结构的分辨率在10kb。


图片1.jpg


随着研究的深入,越来越多的研究者希望通过Hi-C技术去分析DNA loop结构。在染色体的折叠过程中,DNA loop环的形成让线性距离上相隔很远的位点有机会靠近并发生互作,这些loop的类型有很多种,包括enhancer–promoter loop, Polycomb-mediated loop, gene loop, architectural loop等(图1),准确的call loop是远距离互作分析的关键,对Hi-C分析云里雾里的你,是否和小编有过同样的困惑:测多少数据、分析到多深的分辨率才能有效的获得loop信息呢?


其实,我们一直有一套科学的数据量推荐方法,今天小编就从已发表文献的数据整理说起,总结Hi-C分析,特别是高分辨率下的loop分析对测序数据量的真实需求,另有安诺Hi-C实测大数据的首次展示,掰开了揉碎了给大家说道说道我们Hi-C数据量推荐的依据和实战经验~


不同类型的染色质loop结构

图1 不同类型的染色质loop结构

(enhancer–promoter loop, Polycomb-mediated loop, gene loop, architectural loop)


发表文章数据统计


首先,我们看一下Cell期刊上的两篇经典文献对于数据量的要求~


A 3D map of the human genome at kilobase resolution reveals rinciples of chromatin looping. Cell, 2014.


说到已发表文章,自然少不了Erez Lieberman Aiden教授在2014年发表的1kb分辨率文章,达到了当时最高的分辨率。在该篇文章中,人淋巴细胞样本GM12878的测序数据为6.5 billion reads,用于分析的有效数据量为4.9 billion contacts,valid ration(%)在70%以上,达到了950bp的分辨率。


表1


Multiscale 3D Genome Rewiring during Mouse Neural Development. Cell, 2017.


接着,我们看一下2017年发表在Cell上的文章,该篇研究样本最高分辨率为750 bp,call loop所测最低数据量为7.2 billion reads,用于分析的有效数据量为2.9 billion contactsvalid ration(%)在40%左右


表2


安诺实测大数据


为了与发表文章进行对比,小编在此公布安诺实测大数据结果,注意哦!是大数据,不是小数据评估结果,大数据可要比小数据难把控很多滴~


下表为安诺两例小鼠细胞样本(Sample A、Sample B)的实测大数据结果:


表3


表4


两个小鼠细胞样本测序数据量分别为7.16.4 billion reads,用于分析的有效数据量为4.9 billion contactsvalid Ratio>50%,根据文章中的计算公式,此数据达到的分辨率在2kb左右(图2),与发表文献的推荐数据量基本吻合。


分辨率统计

图2 分辨率统计


分析软件大比拼


除了数据量的要求,分析软件的使用也非常关键。2017年发表在Nature Methods上的文章,对10多款分析软件进行了比较分析,在高精度的数据中,HiCCUPS具有最高的保守性。为了更好的展示目前两款主流软件Fit Hi-C和HiCCUPS在call loop分析上的差异,我们进行了实测数据的分析结果对比,见下图。


Fit Hi-C和HiCCUPS软件Call Loop比较

Fit Hi-C和HiCCUPS软件Call Loop比较

图3 Fit Hi-C和HiCCUPS软件Call Loop比较


从这两张对比图中,我们可以明显看出Fit Hi-C 获得的loops数量非常多,特别是近距离的互作,这样很难找到有效的互作位点。相比之下,HiCCUPS可以获得更有效的loops,calling 得到的loops更加准确。因此,对于差异loops分析而言,HiCCUPS更适合。


安诺Hi-C数据量推荐


为了给大家提供更专业和更准确的数据分析结果,安诺基因Hi-C分析团队开发了基于GPU的HiCCUPS软件分析流程,做到了更准确的loop分析结果。基于目前高分文章对HiCCUPS软件的认可,我们强烈推荐人类细胞样本的loop分析测序数据量如下:


图4.jpg


安诺Hi-C专注三维基因组学研究


    1. 合作发表文章平均IF 13.20;

    2. 建库水平一流,低起始量建库无压力;

    3. 采用多款主流分析软件,HiCCUPS实现更准确Loop calling;

    4. 目前国内唯一Hi-C云分析服务提供商,让分析更自主。


参考文献


Rao, S. S. et al. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Cell, 2014, 59, 1665-1680.


Bonev B, Cohen N M, Szabo Q, et al. Multiscale 3D Genome Rewiring during Mouse Neural Development. Cell, 2017, 171(3):557-572.e24.


  • 关注我们
  • 安诺基因
  • 医学健康

  • www.annoroad.com

网站地图 隐私说明 使用条款 联系我们

Copyright2012 genome.cn 安诺优达 版权所有

All rights reserved Annoroad JICP备12029022号-4

Hi-C信息分析,你的数据量够了吗?-成果展示-新闻中心-安诺优达
展开