在numpy
中,陣列可以看作是一系列數值的有序集合,可以通過下標訪問其中的元素,
處理陣列的程序中,經常需要用到陣列過濾功能,
過濾功能可以在處理資料時非常有用,因為它可以使資料更加干凈和可讀性更強,
例如,在進行資料分析時,通常需要去除例外值,過濾掉不必要的元素可以使資料更加易于分析和處理,
numpy
本身提供了很多針對特定要求的過濾函式,
不過本篇只介紹最基本的過濾方式,通過最基本的過濾方式來揭示其過濾的原理,
1. 比較
比較是過濾的前提,因為通過比較才能確定過濾的條件,
1.1. 陣列和單個數字
import numpy as np
arr = np.random.randint(0, 10, (3, 3))
print(arr)
#運行結果
[[4 1 4]
[7 6 1]
[8 9 5]]
print(arr > 5)
#運行結果
[[False False False]
[ True True False]
[ True True False]]
陣列和單個數字比較,也滿足上一篇介紹的廣播原則,也就是陣列arr
的每個元素都和數字5
進行了比較,
比較的結果是和arr
相同結構的陣列,陣列中的元素是bool
值,
滿足比較條件是True
,不滿足比較條件的是False
,
1.2. 陣列和陣列
除了和單個數字比較之外,陣列之間也是可以比較的,
arr1 = np.random.randint(0, 10, (3, 3))
print(arr1)
#運行結果
[[9 7 3]
[2 8 5]
[2 2 3]]
arr2 = np.random.randint(0, 10, (3, 3))
print(arr2)
#運行結果
[[1 6 0]
[0 1 8]
[9 0 5]]
print(arr1 > arr2)
#運行結果
[[ True True True]
[ True True False]
[False True False]]
陣列之間的比較就是相同位置的元素之間比較,如果兩個陣列的結構不一樣,會按照上一篇介紹的廣播計算方式來擴充陣列,
比如:
arr1 = np.random.randint(0, 10, (3, 3))
print(arr1)
#運行結果
[[9 6 0]
[1 4 9]
[1 1 4]]
arr2 = np.random.randint(0, 10, (3, 1))
print(arr2)
#運行結果
[[1]
[0]
[9]]
print(arr1 > arr2)
#運行結果
[[ True True False]
[ True True True]
[False False False]]
上面的陣列arr2,按廣播規則被擴充成:
[[1 1 1]
[0 0 0]
[9 9 9]]
2. 掩碼
所謂掩碼,其實就是上面的各個示例中的比較結果,
也就是只包含bool值的陣列,比如:
[[ True True False]
[ True True True]
[False False False]]
我們就是根據這個掩碼,來過濾出陣列中的True
或者 False
位置的元素,
3. 過濾
過濾就是根據掩碼,選擇出符合條件的元素,
3.1. 單條件過濾
arr = np.random.randint(0, 10, (3, 3))
print(arr)
#運行結果
[[8 4 0]
[2 2 9]
[9 5 9]]
print(arr[arr > 5])
#運行結果
[8 9 9 9]
最后得到的是arr
中值大于5
的元素陣列,
其中 arr > 5
的結果就是上一節提到的掩碼,最后過濾出的元素就是根據這個掩碼得到的,
除了跟單獨的數字比較,也可以和陣列比較:
arr1 = np.random.randint(0, 10, (3, 3))
print(arr1)
#運行結果
[[3 4 7]
[4 6 2]
[7 2 1]]
arr2 = np.random.randint(0, 10, (3, 3))
print(arr2)
#運行結果
[[2 3 1]
[7 7 7]
[1 6 4]]
print(arr1[arr1 > arr2])
#運行結果
[3 4 7 7]
3.2. 多條件過濾
多條件過濾使用 &
和 |
來連接不同的條件,
arr1 = np.random.randint(0, 10, (3, 3))
print(arr1)
#運行結果
[[1 0 5]
[7 4 9]
[8 5 4]]
arr2 = np.random.randint(0, 10, (3, 3))
print(arr2)
#運行結果
[[6 4 1]
[0 1 1]
[8 5 8]]
print(arr1[(arr1 > 5) & (arr1 > arr2)])
#運行結果
[7 9]
過濾arr1
中大于5
** 并且 **對應位置比arr2
大的元素,
arr1 = np.random.randint(0, 10, (3, 3))
print(arr1)
#運行結果
[[1 0 5]
[7 4 9]
[8 5 4]]
arr2 = np.random.randint(0, 10, (3, 3))
print(arr2)
#運行結果
[[6 4 1]
[0 1 1]
[8 5 8]]
print(arr1[(arr1 > 5) | (arr1 > arr2)])
#運行結果
[5 7 4 9 8]
過濾arr1
中大于5
** 或者 **對應位置比arr2
大的元素,
4. 總結回顧
本篇主要介紹了過濾的基本原理,首先從比較開始,比較的結果是掩碼,最后通過掩碼過濾陣列,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/556297.html
標籤:Python
下一篇:返回列表