蛋白转录联合分析如何发IF10+文章?
2018.12.18

上期小编向大家介绍了转录组与蛋白组数据进行联合分析的诸多优势,详情回顾请戳“蛋白牵手转录组,双11优惠嗨不停”(本文末优惠持续放送哦~)。如何利用两组学联合分析发影响因子10+的文章呢?今天小编就以德国Falk Butter团队的两篇果蝇发育研究的文章为例,为大家解析蛋白组与转录组联合分析的文章思路。


蛋白质组揭示果蝇发育机制

The developmental proteome of Drosophila melanogaster


发表期刊:Genome Research

发表时间:2017 年 7 月

材料选择:果蝇完整发育周期(胚胎、幼虫、蛹、成虫)15个节点的组织样本


图1 果蝇发育样本选择

图1 果蝇发育样本选择[1]


实验设计


图2 实验设计思路图

图2 实验设计思路图


研究结果


果蝇完整生命周期的蛋白质组图谱


利用label free的方法对15个节点的果蝇样本进行5h的深度质谱检测,共检测到8549个蛋白,其中核心蛋白4627个(下图左),主要参与代谢和细胞系统的基础活动(下图中)。通过PCA分析显示来自相同发育阶段的蛋白呈现出清晰的蛋白聚类(下图右)。

 

 图3 果蝇发育生命周期蛋白质组特征[1]

图3 果蝇发育生命周期蛋白质组特征[1]


发育进程相关蛋白分析


通过ANOVA分析,作者发现了与发育进程相关的差异蛋白共1535个(下图左)。随后进行GO富集分析来建立蛋白与不同发育时期生物功能的联系:胚胎形成时期与有丝分裂调控、细胞周期、发育所需的激酶系统相关的蛋白得到显著富集。作者将胚胎发育的蛋白进行了区分:早期阶段(0-6h)主要有细胞骨架重塑蛋白、微管结合蛋白、翻译相关蛋白等的高表达,而晚期阶段(12-20h)主要是组织变态发育相关蛋白的高表达(下图右)。幼虫与蛹时期的蛋白主要与角质层结构成分有关。成虫时期,气味结合蛋白、光感蛋白、光传导蛋白、视网膜变性蛋白剧烈表达,与果蝇成虫形成完善的光感应系统呈现出一致性。

 

图4 发育进程相关蛋白分析

图4 发育进程相关蛋白分析[1]


联合分析研究翻译延迟


将胚胎发育蛋白质组与转录组数据进行联合分析,结果表明胚胎发育过程中蛋白的复杂性增加(下图A),转录组与蛋白质组只有中等相关性(最大R = 0.5),且最佳相关性非同步,蛋白组延迟约4-5h(下图B)。作者将mRNA /蛋白质表达谱分组成六个簇(下图C)。在大多数情况下,mRNA表达在早期时间点更丰富,而蛋白质表达在后期达到峰值,可能是由于翻译调控引起的。


 图5 转录-蛋白数据相关性分析

 图5 转录-蛋白数据相关性分析[1] 


本项研究收集了果蝇整个生命周期高质量的蛋白质组数据,填补了系统发育研究在蛋白质组水平的空白。此外,与转录组数据的比较,揭示了mRNA和蛋白质之间的差异相关性,强调了蛋白质组学在研究发育中的重要性。


转录组与蛋白组联合分析揭示果蝇发育的转录后调控机制

Quantifying post-transcriptional regulation in the development of Drosophila melanogaster


发表期刊: Nature Communications

发表时间: 2018 年 11 月

材料选择:果蝇产卵后14个时间节点的胚胎


图6 果蝇胚胎样品选择

图6 果蝇胚胎样品选择[2]



实验设计


图7 实验设计图

图7 实验设计图


实验结果


转录组与蛋白组相关性分析

作者对14个时间节点的样品进行了转录组测序和蛋白质组检测,并对两组学数据进行了相关性分析。作者将3761个成对RNA-蛋白进行了聚类分析,共得到4类表达相关性的变化:525个mRNA与其蛋白协同上调,1063个mRNA与其蛋白协同下调,372个mRNA上调其蛋白下调,1801个mRNA下调其蛋白上调。共有58%的mRNA与其蛋白呈现相反的表达丰度,表明mRNA的动态表达与其对应的蛋白并不直接相关。


图8 成对RNA-蛋白的聚类分析

图8 成对RNA-蛋白的聚类分析[2] 


相关性量化分析


为量化mRNA与蛋白丰度间的关系,作者计算了Spearman相关系数:mRNA与蛋白的同步平均相关性最大值出现在14h(下图a);非同步相关性最高值出现在mRNA 12h与蛋白16h (下图b)。mRNA与较晚时间点的蛋白呈现更好地相关性,很可能是因为蛋白合成中的延迟,当蛋白表达落后于mRNA 4-6小时的情况下,两者间的相关性最高(下图c)。


图9 相关性量化分析

图9 相关性量化分析[2]


调控场景分类


尽管mRNA与蛋白间的相关性有限,作者通过构建数学模型,将84%的mRNA-蛋白对根据不同的时间进程划分为了4个主要的调控场景,包括蛋白合成、延迟合成、静止和降解(下图a、b)。剩余的16%成对mRNA-蛋白与以上模型均不相符(Rejected),表明这些蛋白经历了复杂的转录后调控。


图10 蛋白调控场景分类

图10 蛋白调控场景分类[2]


各调控场景蛋白功能富集分析


随后作者对各个调控类型的蛋白进行了GO分析,探究其特有的生物活动。合成模式中的蛋白在mRNA加工、剪切和RNA代谢活动中富集,表明这些蛋白中存在转录后基因表达的关键调控因子。延迟合成模式中的蛋白则在蛋白分解代谢中富集,暗示在MZT初期,调节母本蛋白降解的因子广泛表达。在Rejected模式中与细胞周期有关的基因发生富集。


图11 蛋白功能富集分析

图11 蛋白功能富集分析[2]


本篇文章分析了大规模的、基于时间序列的果蝇胚胎转录组和蛋白质组数据,为研究转录后基因调控呈现了系统生物学的框架。

 

小结


Falk Butter团队利用蛋白质组技术填补了果蝇系统发育的研究空白,与转录组数据的联合分析为大规模研究转录后调控提供了新思路。随着科研水平的发展,仅从单一组学角度已难以解释许多生物学问题,多组学联合分析因其可以在整体水平解析生物体复杂的生理、病理问题,逐渐成为科研工作者们的新宠。 

 

为助力多组学,安诺基因特推出以下活动:


即日起至2018年12月31日,在安诺基因同时签订转录组与蛋白质组项目,免费送联合分析!


名额有限,先到先得~


更多活动细则,请详询当地销售。


参考文献


[1]Casas-Vila N, Bluhm A, Sayols S, et al. The developmental proteome of Drosophila melanogaster[J]. Genome Research, 2017, 27(7):1273.


[2]Becker Kolja, Bluhm Alina, Casas-Vila Nuria, et al. Quantifying post-transcriptional regulation in the development of Drosophila melanogaster. Nature Communications, 2018, 9, 4970.


在线客服

>>

安诺基因在线客服

客服1 客服2 客服3

电话:400-8986-980