康测云分析平台之维恩图

康测云分析平台之维恩图

维恩图(Venn Diagram),又译作韦恩图、温氏图、范氏图,由十九世纪英国著名哲学家和数学家John Venn发明,通过图形与图形(通常为圆形或椭圆形)之间的层叠展现不同分组(集合)之间的数学或逻辑关系,凸显不同分组(集合)之间共有或特有元素的数量或比例。在生物学领域,维恩图常用于筛选不同分组间共有或特有的元素(如基因、OTU、蛋白等)或在多组学联合分析中鉴定共调控靶标。维恩图操作简单,将繁杂的统计学数据转化为直观形象的图形交叠,更高效地展示不同分组(集合)之间的共性和差异。因此,维恩图也是文章中高频出现的统计图表之一。

 

Venn

 

维恩图

 

上方展示的是最简单的维恩图,也是文章中比较常见的一类维恩图。其中,不同的分组(集合)用不同颜色的圆形表示。重叠区为相交的组别(集合)所共有的元素,数字代表共有元素的数量。非重叠区为对应的组别(集合)所特有的元素,数字代表特有元素的数量。

在熟悉维恩图的作用和组成后,我们将重点介绍如何使用康测云分析平台绘制维恩图。

 

img2

 

康测“四位一体”的云分析平台

 

首先,请输入网址http://www.seqcloud.cc:8888,填写信息进行登录。首次使用康测云分析平台的客户可以联系地区经理获取登录信息。用户名为客户手机号,初始密码为123456。

 

1

 

康测云分析平台登录界面

 

进入首页,点击页面上方“云工具”选项。随后,选择“维恩图”。

 

img4

         

云工具

 

img5

 

维恩图工具

 

左侧的“使用指南”页面对维恩图的主要用途、使用方法和结果解读做了详细介绍。“输入数据预览”页面在导入数据后可查看,便于数据检测和勘误。右侧的“参数设置”页面可进行文件输入和参数调节。“常见问题”页面则解答了文件输入、生成和下载过程中可能遇到的各类问题。需要特别注意的是:维恩图的输出结果有两个。在“结果图片预览”页面可查看和下载维恩图,而在“结果数据预览”页面可查看和下载统计表,表中清楚地展示出元素在各组(集合)中的分布(有则为“1”,无则为“0”)。模块间分界清晰、条理分明,极大地方便了客户学习和使用。

 

img6

 

维恩图操作页面

 

img7

img8

 

维恩图输出结果

 

康测维恩图的“参数设置”并不复杂,方便客户操作和使用。

 

1)任务ID由康测云分析平台自动生成,无需填写。如果分析需要耗费较长时间,系统会第一时间给出提示。客户可以在“云任务”中实时追踪任务状态。康测云分析平台支持一批数据多工具调用,节省客户科研时间。此外,客户可以在“云工单”中随时提交工具修改建议。

 

2)用于绘制维恩图的数据表,第一行通常为各分组(集合)的名称,每一列为对应分组(集合)所包含的全部元素。康测云分析平台提供“示例文件”用于练习。针对具体项目,则需点击“搜索图标”进入“文件管理”,随后点击“上传文件”。上传成功的文件可以在data文件夹中进行查找,接着选择用于绘制维恩图的数据表,点击“确定”,就可以在左侧页面进行数据预览了。需要特别注意的是输入文件应为制表符(Tab键)分隔的文本文件。若发现文件显示乱码,可以点击“使用指南”中的“表格格式转换”工具进行转换。

 

img9

img10

img11

img12

 

文件输入

 

3)根据需要输入图片标题名称,如“Venn plot”

 

img13

 

图片标题填写

 

4) 勾选缺失值形式,需要与输入文件中的一致。通常客户使用维恩图是为了筛选各分组(集合)的共有基因。因此,建议输入文件各分组(集合)中的元素全部填写GeneID,避免填写其他特殊字符,如此此处勾选“空值”即可

 

img14

勾选缺失值形式

 

5)康测颜色面板借助ggsci,提供一系列高质量的、科学期刊和数据库常用的配色方案

 

Name

Reference

custom

自定义

npg

The NPG palette is inspired by the plots in the journals published by Nature Publishing Group

aaas

The AAAS palette is inspired by the plots in the journals published by American Association for the Advancement of Science

nejm

The NEJM palette is inspired by the plots in the New England Journal of Medicine

lancet

The Lancet palette is inspired by the plots in Lancet journals, such as Lancet Oncology

jama

The JAMA palette is inspired by the plots in the Journal of the American Medical Association

jco

The JCO palette is inspired by the the plots in Journal of Clinical Oncology

ucscgb

The UCSCGB palette is from the colors used by UCSC Genome Browser for representing chromosomes. This palette (interpolated, with alpha) is intensively used in visualizations generated by Circos

d3

The D3 palette is from the categorical colors used by D3.js (version 3.x and before). There are four palette types (category10, category20, category20b, category20c) available

locuszoom

The LocusZoom palette is based on the colors used by LocusZoom

igv

The IGV palette is from the colors used by Integrative Genomics Viewer for representing chromosomes. There are two palette types (default, alternating) available

cosmic

Color palettes inspired by the colors used in projects from the Catalogue Of Somatic Mutations in Cancers (COSMIC)

uchicago

The UChicago palette is based on the colors used by the University of Chicago. There are three palette types (default, light, dark) available

startrek

This palette is inspired by the (uniform) colors in Star Trek

tron

This palette is inspired by the colors used in Tron Legacy. It is suitable for displaying data when using a dark theme

futurama

This palette is inspired by the colors used in the TV show Futurama

rickandmorty

This palette is inspired by the colors used in the TV show Rick and Morty

simpsons

This palette is inspired by the colors used in the TV show The Simpsons

flatui

Three flat UI color palettes from Flat UI Colors 2

frontiers

This color palette inspired by Frontiers

 

颜色面板选项

 

6)需要特别注意的是:当分组≥6时,结果展示花瓣维恩图。同时,为避免花瓣维恩图的数字标签发生位置错误,建议分组数量低于20个。并且,在分组数量较多时,建议颜色面板选择“custom”,避免产生空白颜色。此外,对于分组数量较多的情况,还可以考虑upset图(下一期会有详细介绍哦)。大家快来康测云分析平台上体验一波吧~

img15

花瓣维恩图

 

 

创建时间:2023-12-22