生信小课堂•用云平台做WGCNA(单组学), 快速精准筛选核心基因

生信小课堂•用云平做WGCNA(单组学),快速精准筛选核心基因

 

工具简介

如何尽可能多地考虑相关因素并快速、精准的从成千上万的基因中筛选核心标靶是科研中大家最关注的问题之一。加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis,WGCNA)将一定能派上用场!

WGCNA基于基因表达矩阵,通过构建基因共表达网络,对基因进行层次聚类和模块划分,并将其与表型进行关联。最终,鉴定表达模式相似的基因模块(基因集合)、解析基因模块与表型之间的关联、构建基因模块中基因之间的互作网络以及筛选核心基因。

WGCNA在挖掘核心基因方面优势明显。

一、将数量众多的基因划分为数量相对较少且存在关联的基因模块,缩小了核心靶标的筛选范围,便于快速筛选。

二、综合考虑多种关联因素,WGCNA通过挖掘样本、基因、基因模块和表型特征信息,形成关联网络,使核心靶标鉴定更加精准。

三、WGCNA分析结果较为丰富,如层次聚类树、聚类热图等,可以为文章结果呈现添色增彩。

图1 文献中的WGCNA结果图

 

康测科技单组学WGCNA云工具

1. 页面模块化,功能划分简洁

从左往右依次为导航栏、使用指南、数据预览、参数设置和问题解答。

 

图2 工具初始界面

 

2. 零代码操作,参数自由设置

1)基因表达文件输入

该工具输入文件应为制表符(Tab键)分隔的文本文件

 

图3 基因表达文件示例

 

2)表型文件输入(可选)

表型文件为可选项,输入表型文件则进行表型数据关联分析。

 

图4 表型文件示例

 

3)分析参数自由选择

网络阈值:模块之间相关性阈值,调整网络阈值参数会影响网络中节点数目。

模块最小数目:模块是高度互联的基因簇,模块最小数目代表网络节点数不小于此指定值。

分支融合阈值:是在计算完所有模块后,将特征量高度相似的模块进行合并,合并的标准就是所有小于分支融合阈值的模块合并,可以调大(即减少模块)。

模块拆分等级:是分割灵敏度,取值在0到4之间。

离群阈值:基因间连通性分布的平均值取log10,跟分布频率取log10,两者之间有线性关系;用线性模型拟合分布计算R平方,R平方越接近1代表拟合程度越好;离群阈值即为线性公式R平方的阈值,以此来确定构建网络的软阈值保证网络符合无尺度分布。

权重阈值:基因相关性阈值,两个基因间相关性超过这个阈值才算具有相关性。

邻接矩阵方法:计算基因相关性的方法。

ME表型方法:计算模块与表型相关性的方法。

 

图5 参数展示

 

4)图片字体大小设置

图6 图片展示参数

 

康测科技云分析平台试用

康测科技云分析平台整合超过100种组学分析工具,配备详细、精炼的讲解视频工具文档,全程零代码自主参数设置。如果您有使用需求,可私信小编,小编将给您发送试用账号~

链接:http://www.seqcloud.cc:8888

 

参考文献

1.       Langfelder P, Horvath S. WGCNA: an R package for weighted correlation network analysis[J]. BMC Bioinformatics, 2008

创建时间:2024-10-09