一、链特异性(Strand-specificity)简介

链特异性测序(Strand-specific RNA-Seq)是RNA测序(RNA-Seq)的一种改进方法,记录每条测得的序列来自RNA的正义链(sense strand)还是反义链(antisense strand)。

图片

在传统的RNA-Seq中,链的信息通常丢失,而链特异性测序可以帮助更准确地了解基因表达,特别是在下列情况下:

  • 基因重叠区:部分基因在不同链上互为反义转录,链特异性测序可以识别这些转录本的来源。

  • 反义RNA的表达:这类非编码RNA在转录调控中起重要作用,传统测序很难区分它们与正义链上的转录本。

  • 基因簇的解析:密集区域的转录分析会更精准,因为我们知道转录来自哪个链。

二、链特异性测序的原理

链特异性测序的原理主要基于RNA样本制备和文库构建中的化学修饰或酶学反应,保证在反转录(RT)、接头连接或PCR扩增时仅针对某一链进行选择性扩增。常用的链特异性技术包括:

  1. dUTP法(dUTP Incorporation Method)

    • 在RNA逆转录过程中,使用含dUTP的随机引物代替部分dTTP。

    • 第二链的合成后会被特异性降解或不扩增(如通过UNG酶处理),从而只保留第一链的信息。

  2. Ribo-Zero/Poly(A)法结合链特异性

    • 通过去除核糖体RNA(rRNA)或富集poly(A)+ RNA,并结合化学标记实现链特异性。

  3. SMART-seq方法

    • 一种全转录组测序法,可以检测极低丰度RNA,同时保留链信息。


三、链特异性数据的分析流程

链特异性测序的下游分析比普通RNA-Seq复杂一些,需要考虑链信息来提高分析精度。以下是详细的分析流程:


1. 原始数据处理和质量控制
  • 使用FastQC检查原始数据质量,如测序错误率、GC含量分布和接头污染。

  • 如果检测到接头序列,使用Trim GaloreCutadapt进行去接头和低质量片段的去除。


2. 比对到参考基因组
  • 工具:HISAT2STARTopHat2

  • 注意:

    • FR:正义链cDNA在第一条read(R1)中,反义链cDNA在第二条read(R2)中。

    • RF:与FR相反。

    • 在比对时要明确声明链特异性信息,例如HISAT2中的参数--rna-strandness

    • 常见的链特异性参数有:


3. 转录本组装与定量
  • 使用StringTieCufflinks对转录本进行组装。

  • 工具如featureCountsHTSeq-count也支持链特异性计数,需要使用-s参数指定链特异性:

    • -s 1:正义链测序。

    • -s 2:反义链测序。

    • -s 0:不区分链。


4. 差异表达分析
  • 使用工具:DESeq2edgeRlimma-voom

  • 输入:特征计数矩阵(基因 × 样本)。

  • 注意:差异表达分析可以考虑链特异性,以检测反义RNA或重叠基因的表达变化。


5. 功能富集分析
  • 使用clusterProfilerGSEA进行基因本体(GO)分析和通路富集(KEGG/Reactome)。

  • 检测反义RNA、lncRNA等的功能可能需要更多的注释数据库支持。


6. 可视化分析
  • IGV(Integrative Genomics Viewer):用于查看比对结果,检查感兴趣基因在不同链上的表达模式。

  • heatmap.2(R包gplots)或ComplexHeatmap:绘制表达谱热图,观察样本间的表达趋势。

  • ggplot2:用于火山图、PCA等可视化分析。


四、链特异性数据分析中的注意事项

  1. 反义转录本与背景噪音区分:低丰度转录本容易被测序噪音掩盖,需要仔细比对和多次验证。

  2. 比对参数的优化:比对时忽略链信息可能导致假阳性结果。

  3. 文库构建偏好性校正:不同链特异性策略可能有偏向性,需要在分析时校正。

  4. 非编码RNA分析:链特异性测序特别适合分析lncRNA、circRNA等非编码RNA。


五、总结

链特异性测序是解析复杂转录组的一项重要技术,尤其在基因重叠、反义RNA和基因簇分析中具有显著优势。链信息的保留和合理使用,可以提高比对和差异表达分析的准确性,同时为生物学发现提供更深入的视角。

生信大白记第16记,就到这里,关注我!

下一记,持续更新学习生物信息学的内容!

生信大白记邮箱账号:shengxindabaiji@163.com

生信大白记简书账号:生信大白记

生信大白记CSDN账号:生信大白

生信大白记微信公众号:生信大白记

加入生信大白记交流群938339543

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐