上篇【Python入門到底有多簡(jiǎn)單】之groupby數(shù)據(jù)分類匯總(二)中,末尾我們生成文件phylum_1.xlsx,phylum列有單元格是合并狀態(tài),在pandas重新讀取后會(huì)出現(xiàn)NaN,因此需要對(duì)NaN數(shù)據(jù)進(jìn)行填充后分析。本次介紹幾種填充方法。
In [1]:
import pandas as pdIn [2]:
df = pd.read_excel('data/ASV/phylum_1.xlsx') df
Out[2]:
2.1用數(shù)值或字符串填充
In [3]:
NaN處均填充數(shù)值666
df.fillna(666)Out[3]:
In [4]:
NaN處均填充uncultured
df.fillna('uncultured')Out[4]:
2.2用字典填充
In [5]:
字典格式{key1:value1,key2:value2,......}
df.fillna({'phylum':666})
Out[5]:
2.3method參數(shù)填充
2.3.1用前面的值填充
In [6]:
df.fillna(method='ffill')Out[6]:
2.3.2用后面的值填充
In [7]:
df.fillna(method='bfill')Out[7]:
2.3.2用后面的值填充
In [7]:
df.fillna(method='bfill')Out[7]:
2.3.3limit限制填充的個(gè)數(shù)
In [8]:
df.fillna(method='ffill',limit=2)Out[8]:
2.3.4axis=1 修改填充方向
默認(rèn)參數(shù)數(shù)axis=0,按列填充。axis=1則按照行填充。bfill按照后面的值填充
In [9]:
df.fillna(method='bfill',axis=1)Out[9]:
inplace=True直接修改原對(duì)象
inplace參數(shù)默認(rèn)為False,填充后不改變?cè)瓟?shù)據(jù)。inplace=True則將原數(shù)據(jù)直接改變。
df.fillna(method='ffill',inplace=True) dfOut[10]:
往期相關(guān)鏈接:
1、R基礎(chǔ)篇
excel不熟練怎么辦,R來幫您(一)數(shù)據(jù)分類匯總; R相關(guān)軟件及R包安裝; 【零基礎(chǔ)學(xué)繪圖】之繪制venn圖(五);2、R進(jìn)階
ggplot2參數(shù)設(shè)置麻煩?試試ggpar!;
【繪圖進(jìn)階】之通路與菌的相關(guān)性分析熱圖(六);
【繪圖進(jìn)階】之六種帶中心點(diǎn)的PCA 圖和三維PCA圖繪制(四);
【繪圖進(jìn)階】之交互式可刪減分組和顯示樣品名的PCA 圖(三);
【進(jìn)階篇繪圖】之帶P值的箱體圖、小提琴圖繪制(一);
3.python基礎(chǔ)篇
【Python入門到底有多簡(jiǎn)單】之groupby數(shù)據(jù)分類匯總(二);4、數(shù)據(jù)提交
3分鐘學(xué)會(huì)微生物多樣性云平臺(tái)數(shù)據(jù)分析;
3分鐘學(xué)會(huì)CHIP-seq類實(shí)驗(yàn)測(cè)序數(shù)據(jù)可視化 —IGV的使用手冊(cè);
10分鐘搞定多樣性數(shù)據(jù)提交,最快半天內(nèi)獲取登錄號(hào),史上最全的多樣性原始數(shù)據(jù)提交教程;
20分鐘搞定GEO上傳,史上最簡(jiǎn)單、最詳細(xì)的GEO數(shù)據(jù)上傳攻略;
5、表達(dá)譜分析
表達(dá)譜分析(二)通路富集分析和基因互作網(wǎng)絡(luò)圖繪制;如何對(duì)GEO數(shù)據(jù)進(jìn)行差異分析;
miRNA靶基因預(yù)測(cè)軟件__miRWalk 3.0;
6、醫(yī)學(xué)數(shù)據(jù)分析
KING: 樣本親緣關(guān)系鑒定工具;【W(wǎng)GS服務(wù)升級(jí)】人工智能軟件SpliceAI助力解讀罕見和未確診疾病中的非編碼突變;
隱性疾病trio家系別忽視單親二倍體現(xiàn)象——天昊數(shù)據(jù)分析助力臨床疾病診斷新添UPD(單親二倍體)可視化分析工具;
【昊工具】Oh My God! 太好用了吧!疾病或表型的關(guān)鍵基因查詢數(shù)據(jù)庫,我不允許你不知道Phenolyzer;
天昊客戶服務(wù)中心
手機(jī)/微信號(hào):18964693703
【本群將為大家提供】
分享生信分析方案
提供數(shù)據(jù)素材及分析軟件支持
定期開展生信分析線上講座
QQ號(hào):1040471849
作者:大熊
審核:有才
來源:天昊生信團(tuán)