m6A修饰简介
与表观遗传的DNA和组蛋白修饰一样,RNA也受到各种修饰,其中mRNA和lncRNA最主要的修饰是腺苷酸N6位的甲基化修饰(m6A)。m6A的修饰在真核生物中非常保守,从酵母、植物到高等动物中都广泛存在。在哺乳动物中,N6位被甲基化修饰的腺苷酸占细胞内所有mRNA腺苷酸的0.1-0.4%左右。RNA的m6A修饰是表观遗传学研究领域热点之一。在细胞内,甲基转移酶复合体(writers:METTL3及METTL14等)和去甲基化酶(erasers: FTO及ALKBH5)维持RNA的m6A水平的动态变化,而m6A识别蛋白(readers: YTHDFs等)特异性识别m6A位点,介导m6A的各种生物学功能。目前,大量研究已经证实m6A修饰具有重要功能:在分子功能层面,m6A修饰影响RNA的转录、加工、运输、翻译、降解等一系列过程;在生物学功能层面,m6A修饰参与调控生长发育、细胞分化、疾病发生发展等生物学过程(Yang et al. 2018)。因此,研究RNA的m6A修饰的动态变化,将在表观转录水水平,解析一些基本生物学问题,揭示疾病的发生发展机制,为寻找m6A调控的新药物靶点提供依据。

RNA的m6A修饰及其功能

meRIP-seq简介及其技术原理
M6A修饰在人转录组RNA中广泛存在,目前研究表明,超过7000个mRNA和300个lncRNA都含有这种修饰;这种修饰富集分布在mRNA的终止密码子附近和3’UTR区域,暗示m6A修饰具有重要的调控功能。很多m6A修饰位点在人和小鼠中保守存在,且某些m6A修饰在不同发育时期,其修饰水平也在不断变化,同样暗示其重要的调控功能。目前对m6A的全基因组研究方法为meRIP-seq的方法,其原理为通过特异识别m6A修饰的抗体,对细胞内具有m6A修饰的RNA片段进行免疫共沉淀。通过对沉淀下来的RNA片段进行高通量测序,进而结合生物信息学分析,即可全基因组范围内对m6A修饰的状况进行系统研究。

m6A-seq的技术原理

产品优势
1、针对不同研究领域提供个性化方案;
2、分析流程全备,数据解读详细,后期数据挖掘可提供个性化分析;
3、结合峰分析策略多种:含Ablife和Piranha两种方法;
4、研究思路丰富:m6A修饰图谱及修饰特征分析,不同实验分组间差异m6A修饰位点和基因鉴定;与RNA-seq、CLIP-seq数据等联合分析,揭示m6A修饰的功能。
meRIP-seq适应样本类型及样品要求
1.样本类型:细胞、组织或RNA;
2.样本要求:RNA,大于10μg,浓度大于200ng/μl,质检合格;细胞干体积大于1000μl;组织样本大于或等于1000mg;
3.样品运输:样品置于1.5mL离心管中,封口膜封好,干冰运输。
4.样品保存:细胞样品或新鲜组织块可用TRIZOL或RNA保护剂处理,液氮冻存后-80℃保存;RNA样品可溶于乙醇或RNA-free的超纯水中,-80℃保存,避免反复冻融。
meRIP-seq的应该场景及分析思路
1. 应该场景:疾病、发育等生物学各方向;
2. 研究思路:
√ m6A修饰图谱及修饰特征分析,不同实验分组间差异m6A修饰位点和基因鉴定;
√与RNA-seq、CLIP-seq数据等联合分析,揭示m6A修饰的功能。
meRIP-seq的应用案例
案例一—— 通过对FTO表达水平存在差异的HeLa细胞进行m6A-seq,并进行了FTO的CLIP-seq,通过整合分析m6A-seq数据和CLIP-seq数据,发现FTO过表达以浓度依赖性的方式特异性地从GGACU和RRACU基序中去除m6A修饰(Li et al. 2019)。

案例二——通过对强毒性和弱毒性的鸭甲肝病毒(DHAV)感染的雏鸭肝脏组织进行m6A-seq测序,首次分析了鸭子mRNA上的m6A修饰水平及分布特征,发现GAAGAAG是修饰基序最丰富的基序,整合分析m6A-seq和RNA-seq数据,发现m6A与DHAV感染雏鸭肝脏中mRNA表达水平总体呈正相关(Wu et al. 2022)。

参考文献
1.Dominissini, D., Moshitch-Moshkovitz, S., Schwartz, S., Salmon-Divon, M., Ungar, L., Osenberg, S. et al. (2012). Topology of the human and mouse m6A RNA methylomes revealed by m6A-seq. Nature, 485, 201-206.
2.Li, Y., Wu, K., Quan, W., Yu, L., Chen, S., Cheng, C. et al. (2019). The dynamics of FTO binding and demethylation from the m(6)A motifs. RNA Biol, 16, 1179-1189.
3.Wu, L., Quan, W., Zhang, Y., Wang, M., Ou, X., Mao, S. et al. (2022). Attenuated Duck Hepatitis A Virus Infection Is Associated With High mRNA Maintenance in Duckling Liver via m6A Modification. Front Immunol, 13, 839677.
4.Yang, Y., Hsu, P.J., Chen, Y.-S. & Yang, Y.-G. (2018). Dynamic transcriptomic m6A decoration: writers, erasers, readers and functions in RNA metabolism. Cell Res.

一、MeRIP-seq分析流程

二、MeIRP-seq数据质量分析

Clean reads数据质量分析

方法描述:碱基质量值是衡量测序质量的重要指标,碱基质量(Q)与测序错误率(P)密切相关,受测序仪状态,测序试剂质量,样本特性等的影响。质量值计算公式如下:

结果展示

GC含量分析

方法描述:对测序reads中四种碱基的分布比例进行评估,检查是否存在AT、CG分离现象,理论上A与T、C与G的含量在整个测序反应中分别相同,且维持 在稳定水平。

有效长度统计

方法描述:去掉index序列、建库平衡用随机碱基及截取掉后面低质量的碱基后,我们用获得的clean reads进行有效长度分析。

cDNA库的代表性分析

方法描述:如果PCR扩增过度,文库中会含有大量序列完全相同的reads。为了保证文库更好代表原始DNA的丰度,本公司在建库中对PCR扩增循环有严格控制。PCR duplication level计算方法为:从测序数据中随机挑选20万reads作为Total Reads,按照如下公式进行计算:PCR duplication level=Duplication reads/ Total reads

结果展示

三、MeIRP-seq结果展示

全基因组定位分析

Reads比对到参考基因组结果

方法描述:根据不同的基因组的特征,选取相对合适的软件,动植物用HISAT2 (Kim D, Langmead B et al. 2015)、真菌或者基因密度较高的物种用Bowtie2(Langmead and Salzberg 2012),根据需要会设定一定的容错率,将有效测序数据(clean reads)比对到参考基因组上。

Reads在基因组不同区域的分布情况

方法描述:统计在基因组上有唯一定位的reads在各个区域的分布情况

基因组的覆盖度分析度和特征分析

方法描述:MeRIP-seq reads随转录单元长度的覆盖强度分析,以距转录起始位点和转录终止位点为标准,把 cDNA平均分成100份,每一份称为一个bin,求落在每个bin中的reads平均数之和,从而得到每个bin上整体的reads覆盖度。

结果展示

把基因平均分成100份,每一份称为一个bin,求落在每个bin中的reads平均数之和,从而得到每个bin上整体的reads覆盖度。

CLIP-seq reads随转录单元长度的覆盖强度分析,将基因的5’UTR, CDS, 3’UTR各平均分成100份,每一份称为一个bin,求落在每个bin中的reads平均数之和,从而得到每个bin上整体的reads覆盖度。

reads在转录起始位点,转录终止位点,起始密码子和终止密码子附近的分布

方法描述:分别以转录起始位点/转录终止位点,翻译起始密码子/终止密码子为原点,统计其上下游1kb范围内reads的分布情况。

结果展示

样本相关性分析

统计落在每个gene上的reads数目,计算每个gene的RPKM值,然后通过比较同一个gene在两个样本中的RPKM值得到两个样本间的相关性。IP项目中,如果实验与对照样本间相关性系数高,则说明两个样本中大部分reads在染色体上的分布情况类似,暗示实验样本结合的RNA/DNA的富集程度和特异性较低。

样本聚类分析

方法描述:在这部分分析中,根据样本相关性系数进行样本间聚类分析。

结合峰分析

结合峰统计

方法描述:本项目使用上述策略,以Input样本为背景,对IP样本进行Peak Calling,得到IP样本特异的结合峰(peak)并进行统计,结果如下:

结合峰宽度统计

方法描述:对实验样本特异的结合峰的宽度进行统计,得到结果如下:

结合峰在参考基因组上的分布

方法描述:统计结合峰在参考基因组上各个区域的分布情况,统计结果如下:

结合峰重叠分析

ABLIRC group

方法描述:维恩图主要展示两次重复实验中重叠的peak的数目。

重复出现的结合峰在参考基因组上的分布:

Piranha group

结合基序分析

结合峰相关基因聚类Gene Ontology 富集分析

方法描述:

1.利用blast将参考基因组的基因序列比对到Gene Ontology数据库,进行GO注释;

2. 提取比对结果,作为背景即background;

3. 根据结合峰相关基因(peak associated gene)注释信息,统计每个基因所在的GO Term,根据每个Term的基因数目,以及背景中此Term的基因数目,用超几何分布检验分析每个Term的显著性。

4. 选取排名前10的GO Term及其校正p-value和百分比图进行展示。

ABLIRC

结合峰相关基因KEGG Pathway富集分析

方法描述

1. 利用blast将参考基因组的基因序列比对到KEGG数据库,进行KEGG注释;

2. 提取比对结果,作为背景即background;

3. 根据结合峰相关基因(peak associated gene)注释信息,统计每个基因所在的KEGG pathway,根据每个pathway的基因数目,以及背景中此pathway的基因数目,用超几何分布检验分析每个pathway的显著性。

4. 选取排名前10的pathway及其校正p-value和百分比图进行展示。

N6-methyladenosine-dependent RNA structural switches regulate RNA–protein interactions.

N6-methyladenosine-dependent RNA structural switches regulate RNA–protein interactions.

RNA结合蛋白通过与单链RNA结合基序(RBM)的结合来控制多种细胞生物学进程,而RBM常被包埋在RNA的结构内部(单链RNA能将自身折叠成各种各样的复杂结构),从而抑制了RNA与蛋白的互作。腺嘌呤第6位氮原子的甲基化(m6A)是一种真核mRNA常见的内部修饰,m6A能被YTHDF2(YTH域家族蛋白2)识别进而影响细胞质mRNA的稳定性。

N6-methyladenosine-dependent regulation of messenger RNA stability.

N6-methyladenosine-dependent regulation of messenger RNA stability.

腺苷酸N6位甲基化是高等真核生物最普遍的RNA修饰,虽然该修饰被发现与细胞的形态和发育相关,但其具体的调控方式却一直未被报道。2014年1月,Wang等人在Nature杂志上以letter的形式,首次报道了m6A调控基因表达的方式。该研究发现 m6A修饰的RNA可以被YTHDF2蛋白特异识别,被该蛋白结合会导致mRNA转运到p-body,从而导致mRNA的降解。因此m6A修饰可以调控mRNA的翻译和稳定性,在该修饰被发现近40年后,首次从机制上揭示了其调控方式。

 如何批量更新博客?就用菊子曰