about huayin
全基因组甲基化测序 甲基化是基因表达的主要调控方式之一,它在维持细胞正常功能、传递基因组印记,胚胎发育、肿瘤发生等方面起着至关重要的作用,更是表观遗传学研究的热点。 全基因组甲基化测序是将重亚硫酸盐处理和illumina hiseq 高通量测序平台相结合,能够绘制单碱基分辨率的dna甲基化图谱。用标准bisμlfite方法处理dna后,未甲基化的胞嘧啶c会脱氨基形成尿嘧啶u。经过pcr扩增,尿嘧啶u替换为胸腺嘧啶t,而发生甲基化的胞嘧啶c保持不变。通过bisulfite处理序列与参考序列的比对,可对全基因组甲基化情况进行定量分析。 全基因组甲基化测序可用于研究物种特定dna区域甲基化与特定表型之间的关联,并进一步研究环境、营养以及其他因素对特定基因甲基化的影响,为人类疾病的发生、治疗,以及动植物分子育种等提供研究基础。 1、实验方案 平台:illumina nextseq 500或hiseq 3000 pe150 数据量:推荐测序深度30~50× (所测物种须有全基因组参考序列) 2、技术优势 (1)高效快速:借助高通量测序平台可以快速检测出全基因组的甲基化情况; (2)性价比高:相对于传统的 pcr sanger测序方法,费用少; (3)检测精度高:单碱基分辨率,精确分析每一个c碱基的甲基化状态。 3、数据分析 3.1 标准信息分析 (1)按标准流程进行数据整理及数据质量评估; (2)bisulfite测序序列与参考基因组比对; (3)甲基化位点检测; (4)全基因组甲基化水平统计:cg、chg、chh的甲基化水平; (5)染色体水平甲基化分布统计; (6)不同基因组功能元件甲基化分布统计; (7)cpg、chg 和chh 甲基化比例统计; (8)差异性甲基化区域分析(dmr); (9)全基因组甲基化图谱绘制。 3.2 高级信息分析 根据客户具体研究进行的个性化分析。 4、技术流程 5、案例分析 案例(1)人类早期胚胎全基因组水平的dna甲基化图谱的绘制 来自北京大学、哈佛大学等机构的研究人员采用全基因组亚硫酸氢盐测序法(whole-genome bisulfite sequencing),对从合子期到植入后的人类早期胚胎甲基化组进行了系统分析。研究人员证实,不同于以往在小鼠研究中观察的结果,主要一波全基因组去甲基化是在2-细胞期完成。并且父方...
rrbs reduced representation bisulfite sequencing(rrbs)是一种准确、高效、经济的dna甲基化研究方法,通过mspi酶识别ccgg酶切位点处理dna,富集启动子及cpg岛区域,并进行 bisulfite处理和高通量测序,同时实现dna甲基化状态检测的高分辨率和测序数据的高利用率。dna甲基化研究一直是疾病研究的热点,与基因表达、表型性状息息相关。 rrbs作为一种高性价比的甲基化研究方法,在大规模临床样本的研究中具有广泛的应用前景。 1、实验方案 测序策略:illumina nextseq 500或hiseq 3000 pe150 数据量:推荐5g clean data 2、技术优势 (1)精确度高:在其覆盖范围内可达到单碱基分辨率,见下表; (2)重复性好:多样本的覆盖区域重复性高达85%-95%,适合多样本间的甲基化差异分析; (3)检测范围广: 覆盖全基因组范围内超过5百万个cpg位点; (4)性价比高:测序区域更有针对性,数据利用率更高。 表1 三种甲基化研究技术比较 甲基化研究方法 bisulfite-seq rrbs medip-seq 覆盖范围 全基因组 主要集中在cpg岛和promoter区域 全基因组范围,但是倾向于高cpg密度和高甲基化区域 原理 bisulfite处理 酶切 bisulfite处理 抗体富集 分辨率 1bp 1bp 100-1000bp 数据量 ≥30x 基因组 3g、5g 4g 鉴定mdr的数量 多 多 少 ...
clip-seq clip- seq,即紫外交联免疫沉淀结合高通量测序(crosslinking-immunoprecipitation and high-throughput sequencing),是一项在全基因组水平揭示rna分子与rna结合蛋白相互作用的革命性技术。 主要原理是基于rna分子与rna结合蛋白在紫外照射下发生耦联,以rna结合蛋白的特异性抗体将rna-蛋白质复合体沉淀之后,回收其中的rna片段,经添加接头、rt-pcr等步骤,再对这些分子进行高通量测序和生物信息学的分析,从而深入揭示rna结合蛋白与rna分子的调控作用及其对生命的意义。 最近几年,这项技术也被应用到mirna靶标鉴定等工作中。在动物体内,成熟的单链mirna与一系列蛋白形成mirna诱导的沉默复合物(risc),结合于靶mrna的3"-utr 区,阻止所结合的mrna的翻译或直接降解靶mirna。基于这一原理,我们可以通过clipseq技术来进行mrna靶基因的筛选。clip-seq方法的应用能够非常明显地降低mirna结合位点的假阳性预测频率,并且减小mirna结合位点搜寻空间的范围,可以在全基因组范围内鉴定ago2蛋白在不同rna上的结合位点。 1、实验方案 测序策略:illumina nextseq 500 se50 数据量:20m clean reads 2、技术优势 (1)全转录组覆盖:与clip芯片相比,可在全转录组范围对蛋白结合位点进行筛选与鉴定; (2)高灵敏度:每个样本可获得数百万条的序列标签,可发现研究转录组上稀有的蛋白结合位点; (3)准确性高: 从活细胞交联开始,反应了体内环境下真实的分子间相互作用; (4)特异性强: 紫外辐射不会造成蛋白和蛋白之间的交联,只会鉴定出蛋白和 rna 之间的相互作用; (4)应用范围广: 特别适用于研究剪接因子rna结合图谱、mirna作用靶点等研究。 3、数据分析 (1)将reads比对到基因组:将预处理reads与reference genome进行mapping,最后得到mapping的sam结果文件,给出mapping结果统计; (2)peak detect:应用sam文件进行peak富集区查找; (3)motif detect:查找结合位点区结构特性,寻找转录因子结合区域的motif结构; (4)基因关联:应用结合位点区位置,确定其周围所涉及的基因; (5)关联基因go差异分析:以参考基因组为背景集对结合位点关联基因进行go富集分析。 4、技术流程 5、案例分析 案例(1)依赖sirt7去乙酰基的u3-55k蛋...
rip-seq rna immunoprecipitation (rip) 是研究细胞内rna与蛋白结合情况的技术,是了解转录后调控网络动态过程的有力工具,能更有效地发现mirna的调节靶点。rip-seq技术使用特异性抗体对rna结合蛋白或者特殊修饰的rna进行免疫共沉淀后,分离纯化rna,通过高通量测序和分析,深度解析与目标蛋白相互结合的rna的区域或种类。 1、实验方案 测序策略:illumina nextseq 500 se50 数据量:20m clean reads 2、技术优势 (1)全转录组覆盖:与rip芯片相比,可在全转录组范围对蛋白结合位点进行筛选与鉴定; (2)高灵敏度:每个样本可获得数百万条的序列标签,可发现研究转录组上稀有的蛋白结合位点; (3)高精确率:可获得高水平的信噪比数据,准确区分真实事件与噪音,精确定位蛋白结合位点; (4)重复性好:深度测序保证了检测随机性,可不需技术重复。 3、数据分析 3.1 标准信息分析 (1)将reads比对到基因组:将预处理reads与reference genome进行mapping,最后得到mapping的sam结果文件,给出mapping结果统计; (2)peak detect:应用sam文件进行peak富集区查找; (3)motif detect:查找结合位点区结构特性,寻找转录因子结合区域的motif结构; (4)基因关联:应用结合位点区位置,确定其周围所涉及的基因; (5)关联基因go差异分析:以参考基因组为背景集对结合位点关联基因进行go富集分析。 4、技术流程 5、案例分析 案例(1)rocaglates把dead-box蛋白eif4a运输到序列选择性翻译抑制物 rocaglamide a(roca)代表一类能够选择性杀伤非整倍体肿瘤细胞和抑制特殊mrna翻译的蛋白合成抑制剂。roca作用于真核起始因子4a(eif4a),一种atp依赖性的dead-box rna解旋酶;它的mrna选择性是作用于高度结构化的5’非翻译区,这一过程高度依赖于eif4a-调节的解旋反应。然而,美国加州大学分子与细胞生物学系研究人员利用rip-seq技术研究发现:rocaglate(药物)治疗也许并不能从表现形式上复制eif4a活性的缺失导致的缺陷,因为这药物实际上只是增加了eif4a和rna的亲和力。特别说明的是5’非翻译区的二级结构对于roca选择性而言只是一个次要的决定因素,同时该roca不会通过降低eif4a有效性来抑制翻译。相反,在体外和细胞中,roca以atp非依赖性的方式特异性地将eif4a夹送到...
chip-seq 染色质免疫共沉淀(chromatin immunoprecipitation,chip)是在体内环境中研究蛋白质与dna相互作用的经典实验方法,广泛应用于组蛋白修饰、特定转录因子的基因调控作用等相关领域。随着新一代测序技术的发展和成熟,染色质免疫沉淀实验与高通量测序的整合——chip-seq,可在全基因组范围对蛋白结合位点进行高效而准确的筛选与鉴定,同时也为研究的深入开展打下基础。 采用特异性抗体对目的蛋白进行免疫沉淀后,分离与其结合的基因组dna片段,再通过高通量测序与数据分析,在全基因组范围内寻找目的蛋白的dna结合位点,并且可以基于多个样品进行差异比较。 1、实验方案 测序策略:illumina nextseq 500 se50 数据量:20m clean reads 2、数据分析 2.1 标准信息分析 (1)与参考序列比对 (2)peak分析 (3)peak在基因功能元件上的分布 (4)peak相关基因分析 (5)peak相关基因的go功能显著性富集分析 (6)peak相关基因的pathway功能显著性富集分析 (7)鉴定样品间差异peak (8)样品间差异peak的基因功能元件分布 (9)样品间差异peak相关基因分析 (10)样品间差异peak相关基因的go功能显著性富集分析 (11)样品间差异peak相关基因的pathway功能显著性富集分析 (12)motif结构域预测 3、技术流程 4、案例分析 案例(1)foxo转录因子作用位点特征 foxo转录因子(foxo)是控制物种寿命的中心调控因子,但是foxo执行特定的细胞功能,包括成人干细胞内稳和免疫功能。foxo直接作用的靶点已经在若干物种和细胞类型中鉴定得到。用meta分析从组织到生物体,以及哺乳动物,秀丽线虫和果蝇的foxo靶向位点的数据。结果表明,foxo作用的特定细胞是与细胞特定功能的相关的。而且foxo在脊椎动物和无脊椎动物中存在相同保守区域的作用位点。这些与生物生长,新陈代谢,抗压力,蛋白质平衡相关的保守区域的结合位点表明,这些生物可能拥有同一个祖先。 图1 foxo转录因子结合组织特异性的共同靶点 图2 foxo转录因子结合靶点维恩图和保守性分析 案例(2) 肝受体x和pparg在癌细胞增殖不同调控机制的定义 肝受体x(lxrs,nr1h2,nr1h3)和p...
circrna测序 环状rna(circular rna)是近年来发现的一类特殊的非编码rna,它大量存在于真核细胞胞质内,是mrna在剪接的过程中,上游exon的5’端与下游exon的3’端剪接到一起,从而形成的首尾相接的环状分子。 研究发现,高等动物中环状rna的种类和含量远远超过预期。circrna具有很多重要的调控功能,如circrna可以作为竞争性内源rna(competing endogenous rna,cerna)结合胞内mirna,阻断mirna对其靶基因的抑制作用。除此以外,circrna也具有调控其他类型rna、调节蛋白质活性等功能。circrna在不同物种中具有保守性和组织表达特异性,且circrna对rnase不敏感,因此它比线性rna更为稳定,所以circrna在疾病新型诊断与治疗方法研发方面有巨大潜力和重要意义。 1、实验方案 测序策略:illumina nextseq 500或hiseq 3000 pe 150 数据量:推荐8-12g clean data 2、技术优势 (1)多物种选择:可直接对人、大鼠和小鼠样本进行最全面的circrna分析,亦可发现新的circrna(其他物种需特殊评估); (2)高精确度:数字化信号,可预测到基因家族中相似基因以及不同可变剪切类型产生的circrna序列信息; (3)高覆盖度:新一代高通量测序技术的高深度覆盖,可以检测到低丰度的稀有circrna。 3、数据分析 3.1标准数据分析 (1)参考序列比对分析 (2)circrna鉴定 (3)circrna 来源基因分析 (4)circrna表达水平分析 (5)样本之间差异表达的circrna (6)差异circrna筛选 (7)差异circrna聚类分析 (8)差异circrna来源基因go富集分析 (9)差异circrna来源基因kegg富集分析 (10)mirna 结合位点预测 4、技术流程 5、案例分析 案例(1)环状rna促进结肠癌增殖和转移 研究者对正常组织和肿瘤结肠组织样本进行了circrna测序,结果发现大量在肿瘤细胞中特异性升高的circrna,其中一些circrna得到了rt-pcr实验结果的验证。研究人员对其中一类新的circrna——circccdc66的功能进行了深入研究。结果表明circccdc66在息肉和结肠癌中表达水平升高,并且与不良预后相关。通过在结直肠癌细胞系中进行功能获得性研究和功能缺失性研究,研究人员证明circccdc66能够控制多个生理过程,包括细胞增殖、迁移、侵袭和...
小rna测序 小rna是一类高度保守的小rna分子,它可以参与基因表达与调控、rna的加工与剪切、蛋白质翻译、遗传“入侵”抑制、配子发生等重要生物学过程,是生命活动中必不可少的调控因子。小rna测序技术采用胶分离技术,收集样本中18-30nt的rna片段,利用高通量测序技术对样本中所有small rna家族进行测序和表达定量,从而解析mirna 、sirna 、pirna 其它非编码rna等序列,并预测新的小rna及其靶基因。 1、实验方案 测序策略:illumina nextseq 500 se50 数据量:推荐10m clean reads 2、技术优势 (1)通量高:一次测序得到上千万条序列; (2)分辨率高:可以检测小rna单个碱基的差异; (3)精准度高:从几个到几十万个拷贝精确计数; (4)可重复性好:深度测序保证了抽样随机性,重复性好,无需重复实验; (5)检测范围广:既能鉴定已知小rna,又能发现新的小rna。 3、信息分析 3.1 标准信息分析 (1)按标准流程进行数据整理及数据质量评估; (2)样品间的公共序列和特异序列分析; (3)小rna与参考基因组比对分析; (4)按照优先级将小rna进行分类注释 (5)novel small rna预测; (6)样本间mirna差异表达分析; (7)已知mirna的家族分析; (8)已知mirna差异分析(≥2个样本)和聚类分析(≥3个样本); (9)已知mirna和novel mirna的靶基因预测; (10)已知mirna和novel mirna的靶基因go注释和kegg通路分析; (11)novel mirna差异分析(≥2个样本)和聚类分析(≥3个样本); (12)差异mirna靶基因预测; (13)已知mirna的碱基编辑分析; 3.2 高级信息分析 (1)snorna注释 (2)pirna注释 (3)mir2disease注释 4、技术流程 5、案例分析 案例(1)小鼠早期胚胎发育过程中小rna的动态变化及其生物学功能 该研究利用优化的方法系统解析了小鼠卵子到受精后8细胞胚胎发育过程中的小rna动态变化,发现小鼠卵子和早期胚胎主要包含三类小rna:endo-sirna、pirna和mirna。受精卵中的这三类小rna绝大多数来源于卵子,由精子带入卵子的小rna不足几百分之一。随着胚胎的发育,母源endo-sirna和pirna逐渐被缓...
lncrna测序 长链非编码 rnas(long non-coding rnas,lncrnas)是一类长度在200nt以上且不编码蛋白质的rna,以带polya尾和不带polya尾两种形式广泛存在于各种生物体内,参与细胞内多种过程调控,具有跨物种的低保守性,组织特异性表达和丰度低等特点。 近年来的研究表明,lncrna参与了x染色体沉默、基因组印记、染色质修饰、转录激活、转录干扰和核内运输等多种重要的调控过程,但绝大部分lncrna的功能目前仍不清楚。应用高通量测序技术,研究人员能够快速获得与疾病或者特定生物学过程相关的lncrna 并进行深入研究。 1、实验方案 测序策略:illumina nextseq 500或hiseq 3000 pe150 数据量:推荐12g clean data 2、技术优势 (1)任意物种检测:相对传统芯片而言,无需预先设计特异性探针,因此无需了解物种基因或基因组信息,能够直接对任何物种进行最全面的转录组分析; (2)分辨率高:可以检测转录本中单碱基的差异; (3)检测范围广:从几个到数十万个拷贝精确计数,可同时鉴定正常和稀有的转录本; (4)信息分析广:可以做基因差异表达分析、可变剪切、融合基因分析;新转录本预测及注释。 3、 数据分析 3.1 标准信息分析 (1)数据过滤及质量评估 (2)核糖体rna去除率计算 (3)比对参考基因组及统计 (4)基因表达水平分析 (5)基因表达差异及聚类分析 (6)差异基因kegg生物通路富集分析(仅限于模式物种) (7)差异基因go功能富集分析(仅限于模式物种) (8)已知mrna表达量分析 (9)已知mrna差异表达及聚类分析 (10)已知lncrna表达量分析 (11)已知lncrna差异表达及聚类分析 (12)预测新lncrna (13)新lncrna鉴定和表达量分析 (14)新lncrna差异表达及聚类分析 (15)新lncrna家族分析 (16)snp和indel检测与注释 (17)生物学重复样品间相关性分析 (18)蛋白互作网络分析 (19)基因融合 (20)主成份分析(pca) (21)特征性差异表达基因分析 (22)lncrna保守性分析 (23)可变剪切 3.2 高级分析 (1)已知mrna-lncrna共表达网络构建 (2)基因结构优化及优化基因的表达值计算 (3)eqtl分析 4、技...
转录组测序 转录组测序是利用第二代高通量测序技术快速获取某一物种特定器官或组织在某一状态下几乎所有转录本的序列信息,进行疾病与正常样本间的基因表达差异分析、可变剪切和融合基因分析,寻找与癌症、遗传病相关的致病基因,已广泛应用于基础研究、临床诊断和药物研发等领域。相对于传统芯片而言,无需预先设计特异性探针,具有分辨率高、检测范围广和准确率高的优点。 1、实验方案 测序策略:illumina nextseq 500或hiseq 3000 pe150 数据量:推荐8g clean data,细菌和真菌视转录组大小情况而定 2、技术优势 (1)任意物种检测:相对于传统芯片而言,无需预先设计特异性探针,因此无需了解物种基因或基因组信息,能够直接对任何物种进行最全面的转录组分析; (2)分辨率高:可以检测基因家族中相似基因及可变剪接造成的单碱基差异; (3)检测范围广:从几个到数十万个拷贝精确计数,可同时鉴定正常和稀有的转录本; (4)信息分析全面:可以做基因差异表达分析、可变剪切、融合基因分析、新转录本预测及注释。 3、信息分析 3.1 标准信息分析 (1)按标准流程进行数据整理及数据质量评估; (2)与参考序列比对,计算不同基因的rpkm值; (3)基因的差异表达分析; (4)样本间基因表达水平的相关性分析(仅限于有生物重复的样本); (5)样本间差异基因韦恩图及pca分析; (6)差异基因的表达模式聚类分析; (7)差异表达基因go功能富集分析; (8)差异表达基因pathway显著富集分析; (9)差异表达基因的蛋白质互作网络分析; (10)条件特异表达; (11)鉴定基因的可变剪切; (12)snp/indel分析; (13)新转录本预测及注释; (14)融合基因分析(仅限于人); 3.2 高级信息分析: (1)基因结构优化(只针对真核生物) (2)rna编辑 (3)差异基因的转录因子分析(适用于植物) 4、技术流程 5、案例分析 案例(1)科学家绘制细胞周期的高分辨率转录组图谱 细胞周期的推进很大程度上依赖于周期性基因表达。本研究绘制了细胞周期的高分辨率转录组图谱,揭示了周期性基因与癌症之间的新关联。研究人员在两个连续的细胞周期中对人类细胞进行rna测序...