輸入是:
具有 500 列和 10 行的 Panda Dataframe,其中包含一系列介于 0 和 10000(包括在內)之間的隨機整數
包含 0 到 10000 之間的 10 個隨機整數的串列
我正在尋找的輸出是:
具有 500 列和 10 行的 Panda Dataframe,它給出布林值 true 或 false,具體取決于第 x 行中的元素是高于(true)還是低于(false)串列的第 x 個元素的數字
我能夠使用以下函式在 excel 中解決這個問題:
- =RANDARRAY(10,1,0,10000,TRUE)
- =IF(RANDARRAY(10,500,0,10000,TRUE)>A1,TRUE,FALSE)
有沒有一種優雅的方式在 python 中產生這個解決方案?我仍然是一個初學者,正在學習更多關于 python 的知識。
感謝您的幫助
更新:使用 MSS 的解決方案,這是我的最終代碼。你能告訴我我的代碼是否有任何錯誤嗎?
import numpy as np
import pandas as pd
import random
df = pd.DataFrame(np.random.randint(0,10000,size=(10, 500)))
df.head
list = random.sample(range(10000), 10)
print(list)
a = df.to_numpy()
b = np.array(list)
res = pd.DataFrame(a > b[:,None], index= df.index, columns=df.columns)
print(res)
感謝您的幫助
uj5u.com熱心網友回復:
您可以使用 numpy 以這種方式執行此操作。
a = df.to_numpy() # Dataframe of shape (10,500)
b = np.array(your_list) # your_list contains 10 random numbers >=1 and <=10000
res = pd.DataFrame(a > b[:,None], index= df.index, columns=df.columns)
讓我們使用一個具有 3 行和 5 列的較小資料框和一個具有 3 個數字的串列來解釋。所有數字都是 1-9 之間的亂數。
inter = np.array([[1,2,3,5],[4,5,6,1],[7,8,9,5]])
df = pd.DataFrame(inter)
your_list = [3,6,7]
應用上述代碼后得到的輸出為:
0 1 2 3
0 False False False True
1 False False False False
2 False True True False
因此解決方案是正確的。
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/497815.html