我有幾個 DataFrame 正在清理資料。下面的代碼獨立作業(在函式之外),但是,我必須將它應用于許多 DataFrame 并希望通過用戶定義的函式來清理這個程序。您能否幫助修復以下問題,以便它可用于我的所有資料幀。
def format_df(df):
df.columns = df.columns.str
df.dropna(thresh=1, axis='columns',inplace = True)
df.dropna(thresh=80,axis=0,inplace = True)
df.columns = df.iloc[0]
df = df.iloc[1:].reset_index(drop=True)
df.columns = df.columns.str.replace(' ','',regex=False)
df.columns = df.columns.str.replace('($)','',regex=False)
df.columns = df.columns.str.replace('(Y/N)','Flag',regex=False)
df.columns = df.columns.str.replace('(x)','',regex=False)
df.columns = df.columns.str.replace('-','',regex=False)
return df
uj5u.com熱心網友回復:
該行df.columns = df.columns.str
不會運行,因為 df.columns.str 是一個字串方法而 df.columns 是一個索引。相反,您可以使用astype方法:
df.columns = df.columns.astype(str)
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/402283.html