python DataFrame資料格式化
文章目錄
- python DataFrame資料格式化
- 1.設定小數位數
- 1.1 資料框設定統一小數位數
- 1.2 資料框分別設定不同小數位數
- 1.3 通過Series設定DataFrame小數位數
- 1.4 applymap(自定義函式)
- 2. 設定百分比
- 3. 設定千分位分隔符

參考: python資料分析從入門到精通 明日科技編著 清華大學出版社
1.設定小數位數
1.1 資料框設定統一小數位數
以保留小數點后兩位小數為例:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.random([5, 5]), columns=['A1', 'A2', 'A3','A4','A5'])
print(df)
print("==================================")
print(df.round(2))
1.2 資料框分別設定不同小數位數
以A1列保留小數點后一位、A2列保留小數點后兩位為例
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.random([5, 5]), columns=['A1', 'A2', 'A3','A4','A5'])
print(df)
print("==================================")
print(df.round({'A1': 1, 'A2': 2}))
1.3 通過Series設定DataFrame小數位數
通過Series物件設定df小數位數,A1一位,A2零位,A3二位小數
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.random([5, 5]), columns=['A1', 'A2', 'A3','A4','A5'])
print(df)
print("==================================")
s1 = pd.Series([1, 0, 2], index=['A1', 'A2', 'A3'])
print(df.round(s1))
1.4 applymap(自定義函式)
通過自定義函式設定小數位數,回傳型別為object,以設定為二位小數為例
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.random([5, 5]), columns=['A1', 'A2', 'A3','A4','A5'])
print(df)
print("==================================")
print(df.applymap(lambda x: '%.2f'%x))
- 用于對DataFrame的 每一個資料操作使用**applymap()**方法
- 用于對DataFrame中的資料進行按行或者按列 操作 apply() 方法
- 用于對Series中的每一個資料 操作 使用**map()**方法
更詳細可以點擊訪問blog:python資料分析apply(),map(),applymap()用法歸納
2. 設定百分比
學習以下代碼:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.random([5, 5]), columns=['A1', 'A2', 'A3', 'A4', 'A5'])
print(df)
print("==================================================================")
df['百分比'] = df['A1'].apply(lambda x: format(x, '.0%')) # 整列保留0位小數
print(df)
print("==================================================================")
df['百分比'] = df['A1'].apply(lambda x: format(x, '.2%')) # 整列保留兩位小數
print(df)
print("==================================================================")
df['百分比'] = df['A1'].map(lambda x: '{:.0%}'.format(x)) # 整列保留0位小數,也可以使用map函式
print(df)
3. 設定千分位分隔符
import pandas as pd
data = [['aaaaaaa', '1月', 49768889], ['bbbbbbb', '2月', 11777775], ['ccccccc', '3月', 13799990]]
columns = ['name', 'month', 'num']
df = pd.DataFrame(data=data, columns=columns)
print(df)
print("================================================")
df['num'] = df['num'].apply(lambda x: format(int(x), ','))
print(df)
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/439219.html
標籤:AI