人基因组重测序是基于二代测序技术的人基因组测序主要集中于用来分析单核苷酸变异(SNV))以及小片段插入缺失突变(InDel),在一些重复序列区域的变异检测以及大片段的结构变异(SV)检测中面临着挑战,而PacBio三代长读长测序可以覆盖长的结构变异序列,低深度的三代测序能有效鉴定人基因组中大部分结构变异。
三代人基因组重测序发现Carney综合症相关结构变异
Long-read genome sequencing identifies causal structural variation in a Mendelian disease
研究背景
Carney综合征(Carneycomplex, CNC)是一种罕见的常染色体显性遗传疾病,多发心脏和皮肤黏液瘤,常伴有皮肤色素沉着与内分泌过度等症状。位于17号染色体的抑癌基因PRKAR1A与CNC发病有关,因此又称为CNC1基因,该基因的突变可引起肿瘤发生。
实验策略
PacBio Sequel 测序构建10 kb DNA文库,测序总数据量26.7 Gb,深度8.6 X。
通过与作为对照的NA12878三代测序参考序列比对,筛选结构变异,最终获得20个deletions 和16个insertion,其中与疾病相关的各有3个。
经过进一步的人工筛选,有一个长为2,184 bp且覆盖Carney综合征致病基因(PRKAR1A)第一个编码外显子的杂合缺失最终被认定为导致该患者Carney综合征的致病性变异,这一结果最终得到了Sanger测序验证。
本研究通过对疑似Carney综合症的患者进行低深度的三代测序找到了之前二代测序没有发现的致病基因PRKAR1A第一个外显子上的杂合缺失。表明三代长度长测序在鉴定结构变异上的优势。
Merker J D, Wenger A M, Sneddon T, et al. Long-read genome sequencing identifies causal structural variation in a Mendelian disease[J]. Genetics in Medicine Official Journal of the American College of Medical Genetics, 2017, 20(1).
Q 三代人基因组重测序检测结构变异需要多少数据量?
A 根据已发表的文章数据表明10 X左右的低深度三代测序数据就能有效的鉴定出人基因组中的大部分结构变异,因此我们推荐的测序深度是10 X~20 X左右,如果深入挖掘变异信息,30 X数据量最好。
Q 三代人基因组重测序主要能够检测到哪些类型的结构变异?
A 染色体缺失、插入、重复、倒位、易位等结构变异均可以通过三代测序检测到。