很多人覺得數(shù)據(jù)分析入門很難,但隨著B站和公眾號上的學(xué)習(xí)資源越來越多,學(xué)習(xí)數(shù)據(jù)分析已經(jīng)變得非常簡單。以下面為例,從一張規(guī)則的表格中,根據(jù)門水平名稱,生成對物種門水平的表格文件。
In [1]:
import pandas as pd
讀取文本文件pd.read_table,讀取excel文件,
可以用df = pd.read_excel('*.xlsx',sheet_name='*')。
In [2]:
df = pd.read_table('subsample_otu.tax.0.03.xls')
如下圖所示,門水平有12個門的數(shù)據(jù)。
In [3]:
df['phylum'].unique()Out[3]:
array(['Acidobacteria', 'Actinobacteria', 'Armatimonadetes', 'Bacteroidetes', 'Chloroflexi', 'Firmicutes', 'Fusobacteria', 'Gemmatimonadetes', 'Planctomycetes', 'Proteobacteria', 'Spirochaetes', 'Synergistetes'], dtype=object)
In [4]:
for i in df['phylum'].unique(): df[df['phylum']==i].to_excel(i+".xls",index=False)Out[4]:
往期相關(guān)鏈接:
1、R基礎(chǔ)篇
excel不熟練怎么辦,R來幫您(一)數(shù)據(jù)分類匯總; R相關(guān)軟件及R包安裝;【零基礎(chǔ)學(xué)繪圖】之氣泡圖繪制(六);
2、R進階
【繪圖進階】之六種帶中心點的PCA 圖和三維PCA圖繪制(四);
【繪圖進階】之交互式可刪減分組和顯示樣品名的PCA 圖(三);
3、數(shù)據(jù)提交
3分鐘學(xué)會微生物多樣性云平臺數(shù)據(jù)分析;
3分鐘學(xué)會CHIP-seq類實驗測序數(shù)據(jù)可視化 —IGV的使用手冊;
10分鐘搞定多樣性數(shù)據(jù)提交,最快半天內(nèi)獲取登錄號,史上最全的多樣性原始數(shù)據(jù)提交教程;
20分鐘搞定GEO上傳,史上最簡單、最詳細的GEO數(shù)據(jù)上傳攻略;
4、表達譜分析
表達譜分析(二)通路富集分析和基因互作網(wǎng)絡(luò)圖繪制;miRNA靶基因預(yù)測軟件__miRWalk 3.0;
5、醫(yī)學(xué)數(shù)據(jù)分析
KING: 樣本親緣關(guān)系鑒定工具;【W(wǎng)GS服務(wù)升級】人工智能軟件SpliceAI助力解讀罕見和未確診疾病中的非編碼突變;
隱性疾病trio家系別忽視單親二倍體現(xiàn)象——天昊數(shù)據(jù)分析助力臨床疾病診斷新添UPD(單親二倍體)可視化分析工具;
【昊工具】Oh My God! 太好用了吧!疾病或表型的關(guān)鍵基因查詢數(shù)據(jù)庫,我不允許你不知道Phenolyzer;
天昊客戶服務(wù)中心
手機/微信號:18964693703
【本群將為大家提供】
分享生信分析方案
提供數(shù)據(jù)素材及分析軟件支持
定期開展生信分析線上講座
QQ號:1040471849
作者:大熊
審核:有才
來源:天昊生信團