技术支持
Support
UMI标签应满足两个原则
2019-05-30

 UMI标签应满足两个原则

在中描绘了运用unqiue标签随机符号样品中所有方针核酸分子,从而完成数字化计数的原理。为完成尽可能多地的unique符号方针序列,引入样本的标签序列集有必要满足:

I) 要远多于丰度最高的方针序列的拷贝数;

II) 要与方针序列随机结合。

假如满足这两个原则,那么用这种办法对方针分子进行数字化定量就仅受限于测序的深度和准确性。不同于惯例转录组测序基于序列数量进行定量,这种数字化定量技能不再受到下游样品制备和测序中固有扩增噪音和偏好的影响(见图1)。

1.2 UMI标签选用固定序列还是随机序列?

为完成图1中digital RNA-Seq的计划,还需要考虑多个要害的要素。

首要,如上所述,假如标签序列是随机的,那么标签中某个位置上的测序过错将导致该标签被过错辨认。这种过错引起的标签互换现象即便在标签序列非随机时也会发作,除非标签是被严谨规划的,以便即便发作多个替换过错和InDel也不会掩盖标签的真实身份。

其次,由于DNA二级结构会下降扩增功率,标签之间,标签与文库制备和测序运用的接头和引物序列之间,或许标签与关注的转录组序列之间,都不应该有明显的序列堆叠或互补性。理想情况下,标签集不应该包括已知的对测序化学有影响的序列motifs,如长均聚物和GC含量高或低的区域。选用随机序列的标签将难以避免这些问题。

1.3 本项目选用固定序列的UMI标签

运用计算机程序生成了一组满意上述原则的长度为20 bp的145个固定序列的标签。标签序列即便在发作多达4个替换过错,仍能保持明确的辨认。此外,该标签,即便发作9个替换过错或1个InDel加5个替换过错,也不会呈现为另一个标签的序列。

选用标签连接到方针序列两头的战略。假如方针序列的两头随机抽样所有标签,则方针序列将可以接触到145×145= 21,025个unqiue标签。然后,经过paired-end测序可以测定两个标签序列和方针分子序列。这种paired-end战略极大地减少了有必要规划和合成的标签数量,而且与惯例转录组测序计划兼容,并取得长序列信息提高了比对的准确度。此外,将标签连接到序列两头增加了标签采样的整体随机性,由于方针分子的两头不可能具有相似程度的偏好。

 

 




        以上文章来互作转录组,如有雷同请告诉修正,如有转载请阐明出处,有需求请联络哦!