关注的基因表达差异不显著?可下游验证都做完了!

关注的基因表达差异不显著?可下游验证都做完了!

引言

课题研究中,有时我们会遇到这样的情况:通过查阅文献分子实验,筛选到目标基因本来预想补充RNA-seq作为研究拓展和铺垫引入,结果关注的基因不在GO/KEGG富集分析结果中,也不在差异基因列表里!究其原因,竟然是关注的基因在组间的表达差异不显著。在反复检查,排除掉实验和分析问题后,我们不得不仔细思考后续该如何处理?

基于RNA-seq数据更换目标基因前期的分子实验白做了)?降低筛选阈值或更换差异分析软件结果说不准,如果标准过低投稿可能被卡)?觉得这次RNA-seq有问题,重新送样再做一次结果说不准,而且成本不低)?除上述方案外,不妨尝试一下GSEA富集分析

 

表1 富集分析对比

 
基因集富集分析(Gene Set Enrichment Analysis,GSEA),是一种基于基因表达数据的计算方法,用于确定先验定义的一组基因是否在两种生物学状态之间显示出统计学上显著的一致性差异。所以,GSEA强调的是一组基因(基因集),而非单个基因,与生物学状态(表型)的相关性

图1 文献中GSEA的应用

 
GSEA原理:GSEA需要先提供基因表达矩阵、分组信息和定义的基因集。其中,定义的基因集可以使用MSigDB中的基因集或者自定义。当然,前期关注的基因可以整合到基因集中。随后,依据与生物学状态(分组)关联度(即排序指标,比如FC、P Value等),生成基因排序列表。接着,从上到下遍历排序列表中的基因,如果当前基因也存在于定义基因集中,则增加富集得分。如果不存在,则减少富集得分(表现为图中折线的升降)。增加/减少富集得分的多少由排序指标决定。富集得分折线图中最高峰顶或最低峰谷位置的富集得分作为基因集的富集得分,反映基因集的协同趋势(上调/下调)。而基因集中基因在排序列表中的位置分布(上端富集/底层富集)则展现其与哪种生物学状态更相关

图2 GSEA

 
我们可以从知乎、B站等渠道获取GSEA学习资料,但通常还需额外下载软件或学习代码。“担心基础”或“想快速入手”的同学们还可以尝试使用康测科技云分析平台3分钟左右的视频教学、零代码实现轻松上手。

图3 B站上GSEA教学

 
康测GSEA云工具支持多种GeneID来源(Ensembl、GeneSymbol、EntrezID(NCBI)),支持多个物种(不止人和小鼠),更有多种基因排序方法(Signal2Noise、tTest、Ratio_of_Classes和log2_Ratio_of_Classes)供选择。

图4 康测GSEA结果展示(部分)

康测科技云分析平台试用

 

康测科技云分析平台整合超过100种组学分析工具,配备详细、精炼的讲解视频和工具文档,全程零代码、自主参数设置。如果您有GSEA使用需求,可私信小编,小编将给您发送试用账号~

链接:http://www.seqcloud.cc:8888

参考文献

 

 
1.Jinjia Zhang, Junhong Li, Yongqiang Hou, et al. Osr2 functions as a biomechanical checkpoint to aggravate CD8+ T cell exhaustion in tumor[J]. Cell, 2024
 
2.Rui Ding, Xiaoyan Yu, Zhilin Hu, et al. Lactate modulates RNA splicing to promote CTLA-4 expression in tumor-infiltrating regulatory T cells[J]. Immunity, 2024
 
3.Weiwei Yu, Zhen Wang, Xiafei Yu, et al. Kir2.1-mediated membrane potential promotes nutrient acquisition and inflammation through regulation of nutrient transporters[J]. Nature Communications, 2022
 
4.Xiaojing Zhang, Zhigang She, Junyong Wang, et al. Multiple omics study identifies an interspecies conserved driver for nonalcoholic steatohepatitis[J]. Science Translational Medicine, 2021
创建时间:2024-07-02