Python連接es筆記一之連接與查詢es-有解無憂

本文首發于公眾號：Hunter后端
原文鏈接：Python連接es筆記一之連接與查詢es

有幾種方式在 Python 中配置與 es 的連接，最簡單最有用的方法就是定義一個默認的連接，如果系統不是需要訪問多個集群，最建議的方式就是使用 create_connection 方法創建連接，然后所有的操作都會自動使用這個連接，

以下是本篇筆記目錄：

安裝依賴
連接
Search 查詢
Response 回傳結果詳解

1、安裝依賴

我們使用的依賴名稱為 elasticsearch_dsl，我們這里使用的 es 版本是 7.2.0，所以安裝方式如下：

pip3 install elasticsearch_dsl==7.2.0

2、連接

默認連接方式

我們可以通過下面的方式來連接 es：

from elasticsearch_dsl import connections

connections.create_connection(hosts=["localhost"], timeout=20)

或者我們也可以加一個 alias，用作連接的別名，在后面可以很方便的用上：

from elasticsearch_dsl import connections

connections.create_connection(alias="new_conn", hosts=["localhost"], timeout=20)

多集群連接

如果我們想同時連接多個集群，可以使用 configure 方法：

connections.configure(
    default={"hosts": "localhost"},
    dev={
        "hosts": ["example.com:9200"],
        "sniff_on_start": True,
    }
)

使用別名

當使用多個連接的時候，我們可以使用別名，也就是前面的 alias 引數來指代連接：

s = Search(using="default")

3、Search 查詢

接下來介紹下如何在 Python 中查詢 es 資料，

注意下，當我們安裝 elasticsearch_dsl 依賴的時候，系統會自動為我們安裝 elasticsearch 模塊，我們可以直接參考，

我們默認前面已經設定好了全域的 es 連接，之后的操作都基于這個連接：

from elasticsearch_dsl import connections
connections.configure(
    default={"hosts": "localhost:9200"},
)

我們來執行一下查詢和列印操作：

response = Search(using="default").query("match", name="張三豐").execute()
print(response)

可以看到 response 就列印出了我們在之前往 es 的 exam 這個 index 中寫入的資料：

<Response: [<Hit(exam/16): {'name': '張三豐', 'address': '一個蘋果'}>]>

我們先來介紹下執行查詢的操作，

鏈式操作

這個查詢的 API 是鏈式操作，可以允許你鏈接多個操作，比如我們前面的 Search() 后直接跟了 query() 方法，然后直接 execute()，

我們分開執行也是可以的：

s = Search(using="default")
s = s.query("match", name="張三豐")
response = s.execute()

指定 index

在上面的 Search() 方法里，我們通過 using 指定了連接，但是沒有指定 index，那么就默認搜索的是該連接的全部 index，我們可以通過 index() 函式指定 index，也可以向 Search() 中添加 index 引數來指定 index，

s = Search(using="default", index="exam").query("match", name="張三豐")
response = s.execute()

s = Search(using="default").index("exam").query("match", name="張三豐")
response = s.execute()

轉換 es 查詢陳述句

如果我們想要查看執行的陳述句轉換成的 es 的陳述句，可以使用 to_dict() 方法：

s = Search(using="default", index="exam").query("match", name="張三豐")
print(s.to_dict())

# {'query': {'match': {'name': '張三豐'}}}

洗掉陳述句

前面介紹了 s = Search().query() 的 execute() 是執行，獲取回傳結果，to_dict() 是轉換成 es 陳述句，如果是需要洗掉查詢的資料，可以如下操作：

s = Search(using="default").index("exam").query("match", name="張三豐")
s.delete()

4、Response 回傳結果詳解

為了詳細查看 response 中的詳細情況，我們可以在 Python 的 shell 中挨個執行下面的命令，獲得 response 物件，然后再操作 response，當然，前面記得創建 es 的連接：

>>> s = Search(using="default").index("exam").query("match", name="張三豐")
>>> response = s.execute()

對于 response，本身我們可以使用 Python 中的串列的形式來訪問它，來獲取它的資料，比如執行 print(response[0]) 可以看到這條資料本身的資訊：

>>> print(response[1])
# <Hit(exam/24): {'name': '張三豐', 'address': '中國湖北省', 'age': 22}>

如果我們查看 type(response) 可以發現它來源于 <class 'elasticsearch_dsl.response.Response'> 定義了一個 iter() 方法，所以我們可以對這個物件使用迭代方法，

在這個方法內部它迭代的其實是 response.hits 屬性，也就是我們 es 查詢回傳的資料，

所以我們執行 response[0] 和 response.hits[0] 是等效操作，

獲取總數

因為我們上面的查詢操作沒有設定 size，所以默認最多回傳的是 10 條資料，但如果我們想要獲取符合我們查詢條件的總數，我們可以這樣獲取：

count = response.hits.total.value

單條資料詳情

上面介紹了我們可以通過 response[0] 獲得單條資料，對于單條資料，我們還可以獲取更多的詳情資訊，

hit = response.hits[0]

如果我們想一次性獲取回傳的資料的各個欄位及相應的值，我們可以使用 to_dict() 方法：

hit.to_dict()

# {'name': '張三豐', 'address': '中國', 'age': 21}

獲取單個值，比如 name，也可以直接：

print(hit.name)

也可以獲取資料的 meta 資訊，其中包含了這條資料所在的 index，id，匹配分值 score 等：

hit.meta

# {'index': 'exam', 'id': '23', 'score': 0.4700036, 'doc_type'...}

如果想獲取更多后端相關文章，可掃碼關注閱讀：

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/553573.html

標籤：其他

上一篇：Spring注解

下一篇：返回列表