我们专注攀枝花网站设计 攀枝花网站制作 攀枝花网站建设
成都网站建设公司服务热线:400-028-6601

网站建设知识

十年网站开发经验 + 多家企业客户 + 靠谱的建站团队

量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决

GSEA软件的使用方法是什么

GSEA软件的使用方法是什么,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

娄底网站制作公司哪家好,找创新互联!从网页设计、网站建设、微信开发、APP开发、成都响应式网站建设公司等网站项目制作,到程序开发,运营维护。创新互联从2013年成立到现在10年的时间,我们拥有了丰富的建站经验和运维经验,来保证我们的工作的顺利进行。专注于网站建设就选创新互联

Gene Set Enrichment Analysis是一种富集算法,由Broad Institute研究所的科学家提出,算法核心示意如下

GSEA软件的使用方法是什么

需要两个输入元素,一个就是排序好的基因列表,这里的排序的规则是展现两组间的差异,比如按照Foldchange的值进行排序,第二个就是基因的注释集合,然后运行KS检验计算Enrichment Score(ES),用置换检验评估ES的可靠性。

Broad Institute研究所的科学家同时还提供对应的分析软件GSEA,该软件是java语言开发的图形界面软件,简单易用,下载地址如下

http://software.broadinstitute.org/gsea/downloads.jsp

官网提供了多种下载方式,推荐直接下载jar文件,示意图如下

GSEA软件的使用方法是什么

如下所示,运行GSEA分析,需要两个基本元素,第一个就是表达谱数据,可以是芯片数据,也可以是rna-seq的定量结果,第二个就是基因集数据库,官网对于human提供了MSigDB数据库,当然你也可以自己定义基因集。

GSEA软件的使用方法是什么

在实际操作时,第一步首先是导入数据,有以下4种数据需要导入,由于在windows平台操作,通过特定的后缀来识别文件格式

1. expression datasets

表达量文件,可以是芯片,也可以是rna-seq的定量结果,后缀为gct, 示意如下

GSEA软件的使用方法是什么
该文件是\t分隔的纯文本文件,第一行内容总是为#1.2, 表示版本,第二行表示表达量矩阵的维度,第一个值对应探针探针/基因个数,第二个数值代表样本个数,第三行是表达量矩阵的表头,前两列固定是NAMEDescription, NAME是基因ID或者探针ID,必须保证唯一,Description表示描述信息,如果没有,可以用na填充,后面每列对应一个样本。

2. phenotype labels

样本的分组文件,后缀为cls, 示意如下

GSEA软件的使用方法是什么
第一行为空格或者\t分隔的3个数值,第一个数值表示样本总数,第二个数值表示样本对应的分组数目,第三个数值总是1

第二行以#开头,指定不同分组的名字;第三行的每个字段代表一个样本,顺序和表达量文件中的样本顺序一致,只不过将样本名用对应的分组名字表示。

3. gene sets

基因集文件,有多种格式,常用的有gmtgmx, gmt示意如下

GSEA软件的使用方法是什么

每一行代表一个基因集合,第一列为基因集合的名字,必须唯一,第二列为描述信息,如果没有就用na填充,后面的列为该集合下的基因,每列之间用\t分隔。gmt格式示意如下

GSEA软件的使用方法是什么

gmt相反,gmt中每一列代表一个基因集合,第一行为基因集合的名字,必须唯一,第二行为描述信息,如果没有就用na填充,其他行为该集合下的基因。

4. chip  annotation

当提供了芯片数据时,可以导入chip类型的文件,该文件保存的是探针和基因之间的对应关系,后缀为chip, 示意如下

GSEA软件的使用方法是什么

第一列为探针ID, 表头为Probe_Set_ID,第二列为探针对应的基因,表头为Gene Symbol, 第三列为探针描述信息,没有就用na填充。

通过Load Data,首先将以上几种文件导入软件中,然后点击Run GSEA菜单,选择对应的各种文件

GSEA软件的使用方法是什么

phenotype labels用于指定组间比较的顺序,明确哪一组作为control组。

上文中提到,GSEA需要两个输入元素,排序好的基因列表和基因集合,当导入表达量数据和分组信息后,GSEA会自动计算分组将的差异值,然后根据这个差异值对基因进行排序,支持的统计量有以下几种,其中

1. signal2noise

GSEA软件的使用方法是什么

2. t-Test

GSEA软件的使用方法是什么

3. ratio_of_class

GSEA软件的使用方法是什么

4. diff_of_class

GSEA软件的使用方法是什么

5. log2_ratio_of_class

GSEA软件的使用方法是什么
默认的算法为signal2noise, 可以在Basic fields中进行调整,这个参数可以在``示意如下

GSEA软件的使用方法是什么

当所有参数都设置好之后,点击下方的Run按钮即可运行。

关于GSEA软件的使用方法是什么问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注创新互联行业资讯频道了解更多相关知识。


分享标题:GSEA软件的使用方法是什么
标题网址:http://shouzuofang.com/article/jscejo.html

其他资讯