主頁 > 後端開發 > Python連接es筆記三之es更新操作

Python連接es筆記三之es更新操作

2023-05-31 08:03:03 後端開發

本文首發于公眾號:Hunter后端
原文鏈接:Python連接es筆記三之es更新操作

這一篇筆記介紹如何使用 Python 對資料進行更新操作,

對于 es 的更新的操作,不用到 Search() 方法,而是直接使用 es 的連接加上相應的函式來操作,本篇筆記目錄如下:

  1. 獲取連接
  2. update()
  3. update_by_query()
  4. 批量更新
  5. UpdateByQuery()

1、獲取連接

如果使用的是之前的全域創建連接的方式:

from elasticsearch_dsl import connections
connections.configure(
    default={"hosts": "localhost:9200"},
)

我們可以根據別名獲取相應的連接:

conn = connections.connections.get_connection("default")

或者我們直接使用 elasticsearch.Elasticsearch 模塊來重新建立一個連接:

from elasticsearch import Elasticsearch

conn = Elasticsearch(hosts="localhost:9200")

前面介紹過,我們安裝 elasticsearch_dsl 依賴的時候,會自動為我們安裝上相應的 elasticsearch 模塊,我們這里直接使用即可,

然后通過 conn 連接可以直接對資料進行更新,可用的方法有 update(),update_by_query() 以及一個批量的 bulk() 方法,

2、update()

update() 函式一般只用于指定 id 的更新操作,如果我們知道一條資料的 id,我們可以直接使用 update(),

比如對于 exam 這個 index 下 id=18 的資料,我們想要更新它的 name 欄位和 address 欄位分別為 王五和湖南省,我們可以如下操作:

conn.update(
    index="exam",
    id=18,
    body={
        "doc": {
            "name": "王五2",
            "address": "湖南省",
        }
    }
)

在上面的操作中,index 為指定的索引,id 引數為我們需要更新的 id,body 內 doc 下的欄位即為我們要更新的資料,

3、update_by_query()

update_by_query() 函式不局限于 id 的查詢更新,我們可以更新任意符合條件的資料,以下是一個簡單的示例:

conn.update_by_query(
    index="exam",
    body={
        "query": {
            "term": {"name":  "張三豐"}
        },
        "script": {
            "source": "ctx._source.address = params.address",
            "params": {
                "address": "新地址",
            }
        }
    }
)

在這里,index 引數還是指向對應的索引,body 內包含了需要更新查詢的條件,這里都在 query 引數內,需要更新的資料在 script 下,通過腳本的形式來操作更新,

這里注意下,我這里用到的是 7.6.0 版本,所以 script 下使用的 source,更低一點版本用的欄位可能是 inline,這里使用對應版本的引數即可,

在 script.source 中,內容為 ctx._source.address = params.address,意思是將符合條件資料的 address 欄位內容更新為 params 的 address 的資料,

如果想要更改其他欄位內容,注意前面 ctx._source 為固定寫法,只需要更改后面的欄位名即可,

在 script.params 中,我們則可以定義各種對應的欄位及其內容,

更新多個欄位

如果我們想同時更新多個欄位,比如說符合條件的資料將 address 改為 新地址,將 age 欄位改為 28,我們則需要將多個條件在 script.source 中使用分號 ; 連接起來,示例如下:

conn.update_by_query(
    index="exam",
    body={
        "query": {
            "term": {"name":  "新張三豐2"}
        },
        "script": {
            "source": "ctx._source.address = params.address; ctx._source.age = params.age",
            "params": {
                "address": "新地址3",
                "age": "28"
            }
        }
    }
)

雖然這里更新多個欄位需要使用分號連接,但是在實際的代碼中我們不用這么寫死,比如說我們需要更改三個欄位,為 ["address", "name", "age"],我們如下操作:

field_list = ["address", "name", "age"]
source_list = [f"ctx._source.{key}=params.{key}" for key in field_list]

params = {
    "address": "新地址3",
    "age": "28",
    "name": "new name"
}

conn.update_by_query(
    index="exam",
    body={
        "query": {
            "term": {"name":  "新張三豐3"}
        },
        "script": {
            "source": ";".join(source_list),
            "params": params
        }
    }
)

4、批量更新

如果我們想批量更新一批資料,這批資料各個欄位的值都不一致,自定義的程度很大,使用 update_by_query() 函式已經不現實了,怎么辦?

好解決,我們可以使用 helpers.bulk() 批量更新方法,

首先引入這個模塊:

from elasticsearch import helpers

假設我們系統里現在有 id 為 21,23,24 的幾條資料,還是在 exam 這個索引下,我們來構造幾條需要更新的資料來操作:

action_1 = {
    "_op_type": "update",
    "_index": "exam",
    "_id": 21,
    "doc": {"age": 19, "name": "令狐沖", "address": "華山派"},
}

action_2 = {
    "_op_type": "update",
    "_index": "exam",
    "_id": 23,
    "doc": {"age": 20, "name": "楊過", "address": "終南山"},
}

action_3 = {
    "_op_type": "update",
    "_index": "exam",
    "_id": 24,
    "doc": {"age": 21, "name": "張無忌", "address": "武當"},
}
action_list = [action_1, action_2, action_3]
helpers.bulk(conn, actions=action_list)

對于每一條需要更新的資料,有這幾個引數:

_op_type:如果是更新操作,其值則是 update

_index:表示需要更新的資料所在的索引,這里是 exam

_id:表示這條需要更新的資料的 id

doc:是一個 dict 資料,其下包含了需要更新的欄位及其對應的值

至此,一條需要更新的資料的結構就構造完畢了,

然后對于 helpers.bulk() 函式,接收的第一個引數為 es 連接,actions 引數是一個串列,其內容就是我們前面構造的資料的集合,

然后執行這個操作就可以發現 es 中對應的值已經更改了,

5、UpdateByQuery()

UpdateByQuery() 函式來源于 elasticsearch_dsl 模塊,它的使用和 Search() 方法差不多,都是通過 using 和 index 引數來獲取 es 連接和索引:

from elasticsearch_dsl import connections
from elasticsearch_dsl import UpdateByQuery
from elasticsearch_dsl import Q as ES_Q

connections.configure(
    default={"hosts": "localhost:9200"},
)


ubq = UpdateByQuery(using="default", index="exam")

使用這個方法更新資料的具體語法和 update_by_query 差不多,都是通過 script 的方式來操作,以下是一個簡單示例:

ubq = UpdateByQuery(using="default", index="exam")

q1 = ES_Q("term", name="郭靖")

ubq = ubq.query(q1)

ubq = ubq.script(
    source="ctx._source.address=params.address",
    params={
        "address": "襄陽城"
    }
)

ubq.execute()

與 Search() 函式一樣,都需要通過 execute() 函式來向 es 提交資料,

如果想獲取更多后端相關文章,可掃碼關注閱讀:
image

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/553827.html

標籤:其他

上一篇:騰訊二面:有 40 億個 QQ 號,限制 1G 記憶體,問如何去重?被問懵了!

下一篇:返回列表

標籤雲
其他(159991) Python(38189) JavaScript(25464) Java(18161) C(15234) 區塊鏈(8268) C#(7972) AI(7469) 爪哇(7425) MySQL(7217) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5873) 数组(5741) R(5409) Linux(5344) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4579) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2434) ASP.NET(2403) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1977) 功能(1967) Web開發(1951) HtmlCss(1950) C++(1927) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1878) .NETCore(1862) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Python連接es筆記三之es更新操作

    > 本文首發于公眾號:Hunter后端 > 原文鏈接:[Python連接es筆記三之es更新操作](https://mp.weixin.qq.com/s/1cTaVfjLFrmbXajNcayhEA) 這一篇筆記介紹如何使用 Python 對資料進行更新操作。 對于 es 的更新的操作,不用到 Se ......

    uj5u.com 2023-05-31 08:03:03 more
  • 騰訊二面:有 40 億個 QQ 號,限制 1G 記憶體,問如何去重?被問懵了!

    > 40億個QQ號,限制1G記憶體,如何去重? 40億個unsigned int,如果直接用記憶體存盤的話,需要: `4*4000000000 /1024/1024/1024 = 14.9G` ,考慮到其中有一些重復的話,那1G的空間也基本上是不夠用的。 想要實作這個功能,可以借助位圖。 使用位圖的話, ......

    uj5u.com 2023-05-31 07:56:52 more
  • JavaWeb

    # JavaWeb ## 1、基本概念 ### 1.1、前言 web開發: - web,網頁的意思 - 靜態web - html,css - 提供給所有人看的資料始終不會發生變化 - 動態web - 幾乎所有的網站都是動態的 - 提供給所有人看的資料始侄訓發生變化,每個人在不同的時間,不同的地點看到 ......

    uj5u.com 2023-05-31 07:50:35 more
  • 新版idea快捷鍵總結學習----(用于java開發模式)

    ### 選擇代碼區 1. ctrl w - 如果放到以if開頭的陳述句,可以選擇if判斷條件所在的代碼片段 - 游標在單個單詞下時 選擇單詞 - 在選中多個單詞時,選擇整個字串 - 三次點擊時,如果不在字串單詞下,用于選擇{}內的代碼片段 逐級遞增 如果在單詞下方,用于選擇單詞所在的字串并且向外 ......

    uj5u.com 2023-05-31 07:50:18 more
  • geowebCache 切片不同方式的呼叫

    1.curl 方式 curl -v -u admin:geoserver -H "Content-type: application/json" -d "{'seedRequest':{'name':'NR:tdbp','bounds':{'coords':{ 'double':[ '108.790 ......

    uj5u.com 2023-05-31 07:50:09 more
  • np.bincount方法

    [官方檔案](https://numpy.org/doc/stable/reference/generated/numpy.bincount.html#numpy-bincount) `out = np.bincount(x[, weights, minlength])` **該函式用于統計輸入陣列 ......

    uj5u.com 2023-05-31 07:50:04 more
  • JavaWeb編程面試題——Spring Boot

    面試題==知識點,這里所記錄的面試題并不針對于面試者,而是將這些面試題作為技能知識點來看待。不以刷題進大廠為目的,而是以學習為目的。這里的知識點會持續更新,目錄也會隨時進行調整。 ......

    uj5u.com 2023-05-31 07:50:00 more
  • Python 實作 m3u8 視頻下載

    # Python 實作 m3u8 視頻下載 m3u8 是一種**基于文本的媒體播放串列檔案格式**,通常用于指定流媒體播放器播放在線媒體流。它是一個簡單的文本檔案,其中包含多個由 URI 參考的媒體資源檔案的 URL。m3u8 檔案通常包含多個 ts 檔案的鏈接,這些 ts 檔案是實際的視頻和音頻數 ......

    uj5u.com 2023-05-31 07:49:53 more
  • 一文詳解 Sa-Token 中的 SaSession 物件

    Sa-Token 是一個輕量級 java 權限認證框架,主要解決登錄認證、權限認證、單點登錄、OAuth2、微服務網關鑒權 等一系列權限相關問題。 > Gitee 開源地址:[https://gitee.com/dromara/sa-token](https://gitee.com/dromara/ ......

    uj5u.com 2023-05-31 07:49:45 more
  • 如何用ReadWriteLock實作一個通用的快取中心?

    摘要:在并發場景中,Java SDK中提供了ReadWriteLock來滿足讀多寫少的場景。 本文分享自華為云社區《【高并發】基于ReadWriteLock開了個一款高性能快取》,作者:冰 河。 寫在前面 在實際作業中,有一種非常普遍的并發場景:那就是讀多寫少的場景。在這種場景下,為了優化程式的性能 ......

    uj5u.com 2023-05-31 07:49:34 more