技术支持
Support
RIP-seq如何准确锁定目的蛋白结合的RNA?
2019-05-06

 RIP-seq研究的是什么 

RIP-seq(RNA免疫沉淀结合高通量测序)是研究RNA结合蛋白的一种技术,可获得RNA结合蛋白结合(调控)的RNA,以及结合的位置、结合基序,结合强度等信息。

RIP-seq使用目的蛋白特异性抗体与样本孵育,使抗体与目的蛋白结合,然后磁性分离抗体及其结合的目的蛋白,目的蛋白结合的RNA也一并被分离出来,这样我们就获得了目的蛋白和它结合的RNA片段。

RNA片段洗脱、建库、测序,便知目的蛋白结合哪些RNA,结合强度、结合位置、结合基序等丰富的信息,进而还能进行差异结合分析、GO富集分析、KEGG通路富集分析。

 

 1. RNA免疫沉淀获取目的蛋白 

RIP和ChIP的流程类似。我们会首先裂解细胞,释放细胞内所有物质。为了保证免疫沉淀的特异性和效率,我们需要将细胞裂解产物分为几份,设置对照。

第一份我们不进行后续免疫沉淀(IP),作为初始对照(或阳性对照)用于了解样本IP前的情况;

第二份进行IP,即使用特异性抗体富集目的蛋白;

第三份同样进行IP,但是不使用特异性抗体,而是使用IgG进行IP。                             

 

免疫沉淀后,一方面,要对富集的蛋白进行WB质检,检测IP的特异性和目的蛋白的富集效果。

另一方面,还要提取RNA进行定量、构建测序文库,并对文库质检。

 WB质检结果:

  1. 如果目的蛋白在样品中有表达、抗体效果较好,在样品中可以检测到目的蛋白,Input在对应位置产生条带;

  2. 如果使用的抗体能有效富集目的蛋白,那么IP也会在对应位置产生条带;此外还会出现抗体的条带,这是由于抗体与蛋白紧密结合,上样前无法分离,WB质检时加入的酶标二抗结合抗体重链(或轻链)在55kD(或25kD)出现条带。

  3. IgG可帮助我们判断免疫沉淀体系是否对蛋白有非特异性结合或,特异性高的RIP结果应该是无目的条带,仅有IgG的重链(或轻链)条带。

IP与Input比较可判断IP效率(是否有效富集),IgG做阴性对照可判断IP的特异性(是否为特异性富集)。经过这些对照层层把关,RIP实验、RIP-seq的结果才能更有保障、更加高质、可靠。

 

2. Peak Calling锁定目的蛋白结合的RNA 

IP富集的RNA就是目的蛋白结合的RNA了?并不是,或者说并不完全是。

RIP确实会对目的蛋白结合RNA产生富集,那么在参考基因组上、蛋白结合的区域,测序reads的覆盖度升高,相对其他区域形成明显的“峰”。

但是由于RNA表达量本身存在差异,扩增、测序过程又引入偏好,非富集区域的reads覆盖也可能存在高高低低的“峰”,这无疑对筛选结合峰(Peak calling)产生严重干扰。

我们来举个例子:样本中有A mRNA共10条,均被目的蛋白结合,且都被IP下来,样本中还有B mRNA共 100条,其中只有10条被目的蛋白结合,也都被IP下来。目的蛋白对A、B mRNA的结合数目一样,但结合比例明显有天壤之别。这时我们再评判目的蛋白对A、B mRNA的结合,就需要考虑A、B mRNA表达的差异了。

Peak calling时我们会对比input和IP归一化后的reads平均覆盖深度,将input作为背景,进行Peak calling,将input产生的背景“峰”过滤,避免RNA表达等背景因素产生假阳性结果。

如上图所示,IP的reads在蓝色区域和灰色区域的分布较为相似,input的reads数则有较大差异。在蓝色区域,我们通过对比IP和input可以筛选出Peak;但是在灰色区域,因input本身有峰,对比IP和input后发现无法筛选到正真的Peak。

 

 3. 数字标签UMI还原RNA原始丰度 

其实,康测科技在建库时还留了一手,给文库片段都标记了数字标签(UMI)。

RNA结合蛋白对RNA序列是有选择性的,会倾向于结合具有某些特征的序列,因此RIP测序文库碱基平衡性通常不佳,PCR扩增偏好会导致比转录组测序更为严重的测序偏差,因此,UMI的使用也更加必要。

数据分析前,我们先根据数字标签追溯reads来源,同一个片段经过PCR扩增的产物均带有同一UMI,我们根据UMI便能精确追踪reads的来源,对那些由于PCR扩增偏好等种种原因产生的异常扩增的reads归类和去重,再以真实的序列丰度进行Peak calling,达到绝对定量检测。

做到这些,我们才算真正准确锁定了目的蛋白结合的RNA。