上一讲,我们使用deseq2对下载的geo数据进行差异分析,可以获取差异基因列表。那么,在得到差异基因后,我们还可以做哪些分析呢?接下来,小编带着大家使用在线网址进行ppi网络分析和基因富集分析(go和kegg富集),网址:https://string-db.org/
一获取差异基因列表
打开上一节生成的differential_expression_genes_summary.csv文件,统计type类型中up和down的基因数为3157个,ppi string最多允许分析2000个基因,因此我们需要对数据进行下一步过滤,我们选择过滤条件为 padj <0.05 , 筛选到1245个基因。
提取基因名
将筛选到的1245个基因复制到gse132287_gene-count-table.xls文件中的空白列,使用vlookup函数获取我们要返回的值,如下图所示:p2单元格是我们待查找值,a:b是数据表,其中a列要包含待查找值,列序数是返回值所在的列数,匹配条件通常选择精确匹配false,可以简写为数字0 。整个函数的意思是:查找p2单元格在a列中所在的行,返回该行b列的值。
如下图所示,通过vlookup函数,我们返回gene_name数目1245个,用于后续ppi网络分析。
二ppi网络分析
1. 初步分析打开ppi网络网址:https://string-db.org/ ,点击multiple proteins, 在list of names 方框内粘贴1245个基因名,organism 下拉菜单选择human,点击search 开始分析。
2. 富集分析结果过滤
点击analysis,查看分析结果。
下载kegg富集分析结果
下载结果打开,如下图所示:
3、筛选感兴趣的通路,重新做ppi分析
我们选择p值最小的通路 hsa04668 :tnf signaling pathway ,复制对应的g列的44个基因,使用notepad 的替换功能,将',' 替换成 'n', 生成基因列表,用于ppi重新分析。
导入44个基因,重新分析,分析完成后,看到在网页上看到ppi网络图。
往期相关链接:
1、r基础篇
;
;
;
;
;
;
;
2、r进阶
;
;
;
3、数据提交
;
;
;
;
4、表达谱分析
;
5、医学数据分析
;
;
;
如果您对本文案介绍的方法或代码有疑问,
请扫码添加qq群沟通
【本群将为大家提供】
分享生信分析方案
提供数据素材及分析软件支持
定期开展生信分析线上讲座
qq号:1040471849