上一講,我們使用DESeq2對下載的GEO數(shù)據(jù)進(jìn)行差異分析,可以獲取差異基因列表。那么,在得到差異基因后,我們還可以做哪些分析呢?接下來,小編帶著大家使用在線網(wǎng)址進(jìn)行PPI網(wǎng)絡(luò)分析和基因富集分析(GO和KEGG富集),網(wǎng)址:https://string-db.org/
一獲取差異基因列表
打開上一節(jié)生成的Differential_Expression_Genes_Summary.csv文件,統(tǒng)計(jì)type類型中up和down的基因數(shù)為3157個,PPI string最多允許分析2000個基因,因此我們需要對數(shù)據(jù)進(jìn)行下一步過濾,我們選擇過濾條件為 padj <0.05 , 篩選到1245個基因。
提取基因名
將篩選到的1245個基因復(fù)制到GSE132287_Gene-count-table.xls文件中的空白列,使用VLOOKUP函數(shù)獲取我們要返回的值,如下圖所示:P2單元格是我們待查找值,A:B是數(shù)據(jù)表,其中A列要包含待查找值,列序數(shù)是返回值所在的列數(shù),匹配條件通常選擇精確匹配FALSE,可以簡寫為數(shù)字0 。整個函數(shù)的意思是:查找P2單元格在A列中所在的行,返回該行B列的值。
如下圖所示,通過vlookup函數(shù),我們返回gene_name數(shù)目1245個,用于后續(xù)PPI網(wǎng)絡(luò)分析。
二PPI網(wǎng)絡(luò)分析
1. 初步分析打開PPI網(wǎng)絡(luò)網(wǎng)址:https://string-db.org/ ,點(diǎn)擊Multiple proteins, 在List Of Names 方框內(nèi)粘貼1245個基因名,Organism 下拉菜單選擇human,點(diǎn)擊Search 開始分析。
2. 富集分析結(jié)果過濾
點(diǎn)擊Analysis,查看分析結(jié)果。
下載kegg富集分析結(jié)果
下載結(jié)果打開,如下圖所示:
3、篩選感興趣的通路,重新做PPI分析
我們選擇P值最小的通路 hsa04668 :TNF signaling pathway ,復(fù)制對應(yīng)的G列的44個基因,使用Notepad++的替換功能,將',' 替換成 'n', 生成基因列表,用于PPI重新分析。
導(dǎo)入44個基因,重新分析,分析完成后,看到在網(wǎng)頁上看到PPI網(wǎng)絡(luò)圖。
往期相關(guān)鏈接:
1、R基礎(chǔ)篇
【零基礎(chǔ)學(xué)繪圖】之繪制venn圖(五);
【零基礎(chǔ)學(xué)繪圖】之繪制barplot柱狀圖圖(四);
【零基礎(chǔ)學(xué)繪圖】之繪制heatmap圖(三);
【零基礎(chǔ)學(xué)繪圖】之a(chǎn)lpha指數(shù)箱體圖繪制(一);
2、R進(jìn)階
【繪圖進(jìn)階】之交互式可刪減分組和顯示樣品名的PCA 圖(三);
【進(jìn)階篇繪圖】之帶P值的箱體圖、小提琴圖繪制(一);
3、數(shù)據(jù)提交
3分鐘學(xué)會微生物多樣性云平臺數(shù)據(jù)分析;
3分鐘學(xué)會CHIP-seq類實(shí)驗(yàn)測序數(shù)據(jù)可視化 —IGV的使用手冊;
10分鐘搞定多樣性數(shù)據(jù)提交,最快半天內(nèi)獲取登錄號,史上最全的多樣性原始數(shù)據(jù)提交教程;
20分鐘搞定GEO上傳,史上最簡單、最詳細(xì)的GEO數(shù)據(jù)上傳攻略;
4、表達(dá)譜分析
5、醫(yī)學(xué)數(shù)據(jù)分析
【W(wǎng)GS服務(wù)升級】人工智能軟件SpliceAI助力解讀罕見和未確診疾病中的非編碼突變;
隱性疾病trio家系別忽視單親二倍體現(xiàn)象——天昊數(shù)據(jù)分析助力臨床疾病診斷新添UPD(單親二倍體)可視化分析工具;
【昊工具】Oh My God! 太好用了吧!疾病或表型的關(guān)鍵基因查詢數(shù)據(jù)庫,我不允許你不知道Phenolyzer;
如果您對本文案介紹的方法或代碼有疑問,
請掃碼添加QQ群溝通
【本群將為大家提供】
分享生信分析方案
提供數(shù)據(jù)素材及分析軟件支持
定期開展生信分析線上講座
QQ號:1040471849