目前人类已知的疾病中,有4000多种疾病与人类的基因有关。利用全基因组重测序的方法,可以在全基因组水平上检测与疾病相关的突变位点、结构变异等信息,进而找寻攻克这些疾病的治疗手段,研发有效地治疗药物。全基因组测序的应用范围涉及临床医药研究、群体遗传学研究、关联分析、进化分析等众多领域。
1、实验方案
测序策略: illumina hiseq x pe150
数据量:推荐肿瘤50×测序深度/对照癌旁、血液30×测序深度;遗传病30~50×测序深度。
2、技术优势
(1)多种变异检测:单核苷酸多态性(snp)、插入缺失(indel)和结构变异(sv);
(2)与芯片方法相比,可以检测到新的变异序列;
(3)与人类全基因组从头测序相比,耗时更短、成本更低。
3、数据分析
3.1 标准信息分析
(1)按标准流程进行数据整理及数据质量评估;
(2)与参考基因组比对;
(3)snp的检测及其在基因组的分布;
(4)indel的检测及其在基因组的分布;
(5)cnv的检测及其在基因组的分布;
(6)包含变异基因的功能注释(go注释、pathway注释)。
3.2 高级信息分析(肿瘤基因组学)
(1)癌基因/抑癌基因/易感基因筛查;
(2)高频突变基因统计及通路富集分析;
(3)nmf突变特征及突变频率分析;
(4)已知驱动基因筛选;
(5)基因组变异circos图展示。
4、技术流程
5、案例分析
案例(1)胰腺神经内分泌肿瘤的全基因组图谱
胰腺神经内分泌肿瘤(pannets)是第二大胰腺上皮细胞肿瘤,致死率达60%。随着检测手段越来越灵敏,胰腺神经内分泌肿瘤诊断数量呈现上升趋势,这给临床诊疗带来了一定的挑战!在一项新的研究中,研究人员揭示出正常情形下与乳腺癌、卵巢癌和结肠癌相关联的基因变异同样能够促进一种罕见的胰腺癌产生。ewsr1与bend2发生体细胞融合,确定bend2为ewsr1的一个新融合基因。发生体细胞融合的患者,其细胞形态和免疫组化特征具有典型的胰腺神经内分泌肿瘤特征。通过rna-seq和rt–pcr确认了ewsr1和fli1发生体细胞融合。
图1 胰腺神经内分泌肿瘤中的突变特征
案例(2)全基因组测序确定en1作为骨密度和骨折的决定因素
本研究发现欧洲血统人种存在1个新的非编码低频基因突变en1对bmd(n=53236)以及骨折(n=508253)有较大影响。通过全基因组测序(n=2882,uk10k),全外显子测序(n=3549),深度基因分型(n=26534),基因型从头测序(n=20271)数据资料联合分析,发现一个低频非编码突变,很可能是一个新的基因座en1,较以前报道的常见的位于关于腰椎bmd以及降低骨折风险的突变的平均值要高出4倍的相关性。通过建立en1cre/flox小鼠模型,发现缺失了en1会导致小鼠骨密度低以及更大可能的发生骨折。同时也发现了一个靠近wnt16的新的低频非编码突变与bmd有重大关联。
图1 腰椎bmd en1附近的关联信号
参考文献
[1] scarpa et al. whole-genome landscape of pancreatic neuroendocrine tumours. nature, 2017.
[2] zheng et al. whole-genome sequencing identifies en1 as a determinant of bone density and fracture. nature, 2015.