主頁 > 資料庫 > 《Redis設計與實作》讀書筆記

《Redis設計與實作》讀書筆記

2023-04-24 09:01:39 資料庫

《Redis設計與實作》讀書筆記

簡單動態字串

SDS的定義

結構:

buf陣列:用于保存字串

len屬性:記錄SDS中保存字串的長度

free屬性:記錄buf中未使用位元組數量

遵循C字串以空字串結尾的慣例,保存空字串的位元組不計入長度

SDS與C字串的區別

常數復雜度獲取字串長度

因為SDS中的len屬性已經記錄了字串長度,所以不需要像C字串一樣獲取長度時需要遍歷一遍字串,確保獲取字串長度的作業不會限制Redis的性能瓶頸

杜絕緩沖區溢位

當SDS API需要對SDS進行修改時,API會先檢查SDS的空間是否滿足修改所需要的要求,如果不滿足的話,API會自動將SDS的空間擴展至執行修改所需要的大小

減少修改字串時帶來的記憶體重分配次數

C字串修改時,需要程式重新分配記憶體,防止記憶體溢位或泄露,對于一個資料庫來說嗎,對于速度的要求時苛刻的,且資料會被頻繁的修改,而重分配會占用大量時間,修改頻繁的話,可能會對性能照成影響

而SDS通過free屬性,實作了空間預分配與惰性空間釋放兩種優化策略

1.空間預分配

SDS進行修改后len小于1MB時:程式會分配和len相同大小的未使用空間

SDS進行修改后len大于1MB時:程式會分配1MB的未使用空間

2.惰性空間釋放

當需要縮短SDS的字串時,程式不會立刻重分配來回收多余位元組,而是先使用free將這些位元組記錄起來,等待將來再使用

二進制安全

SDS API會以二進制的方式來處理SDS存放在陣列里面的資料

兼容部分C字串函式

因為SDS遵循了C字串以空字串結尾的慣例

SDS API

鏈表

鏈表與鏈表節點的實作

每個鏈表節點使用一個 adlist.h/listNode 結構來表示:

 typedef struct listNode {
 ?
     // 前置節點
     struct listNode *prev;
 ?
     // 后置節點
     struct listNode *next;
 ?
     // 節點的值
     void *value;
 ?
 } listNode;

多個 listNode 可以通過 prevnext 指標組成雙端鏈表

雖然僅僅使用多個 listNode 結構就可以組成鏈表, 但使用 adlist.h/list 來持有鏈表的話, 操作起來會更方便:

 typedef struct list {
 ?
     // 表頭節點
     listNode *head;
 ?
     // 表尾節點
     listNode *tail;
 ?
     // 鏈表所包含的節點數量
     unsigned long len;
 ?
     // 節點值復制函式
     void *(*dup)(void *ptr);
 ?
     // 節點值釋放函式
     void (*free)(void *ptr);
 ?
     // 節點值對比函式
     int (*match)(void *ptr, void *key);
 ?
 } list;

list 結構為鏈表提供了表頭指標 head 、表尾指標 tail , 以及鏈表長度計數器 len , 而 dupfreematch 成員則是用于實作多型鏈表所需的型別特定函式:

  • dup 函式用于復制鏈表節點所保存的值;

  • free 函式用于釋放鏈表節點所保存的值;

  • match 函式則用于對比鏈表節點所保存的值和另一個輸入值是否相等,

 

Redis 的鏈表實作的特性可以總結如下:

  • 雙端: 鏈表節點帶有 prevnext 指標, 獲取某個節點的前置節點和后置節點的復雜度都是 O(1)

  • 無環: 表頭節點的 prev 指標和表尾節點的 next 指標都指向 NULL , 對鏈表的訪問以 NULL 為終點,

  • 帶表頭指標和表尾指標: 通過 list 結構的 head 指標和 tail 指標, 程式獲取鏈表的表頭節點和表尾節點的復雜度為 O(1)

  • 帶鏈表長度計數器: 程式使用 list 結構的 len 屬性來對 list 持有的鏈表節點進行計數, 程式獲取鏈表中節點數量的復雜度為 O(1)

  • 多型: 鏈表節點使用 void* 指標來保存節點值, 并且可以通過 list 結構的 dupfreematch 三個屬性為節點值設定型別特定函式, 所以鏈表可以用于保存各種不同型別的值,

鏈表和鏈表節點的API

字典

字典的實作

哈希表

Redis 字典所使用的哈希表由 dict.h/dictht 結構定義:

 typedef struct dictht {
 ?
     // 哈希表陣列
     dictEntry **table;
 ?
     // 哈希表大小
     unsigned long size;
 ?
     // 哈希表大小掩碼,用于計算索引值
     // 總是等于 size - 1
     unsigned long sizemask;
 ?
     // 該哈希表已有節點的數量
     unsigned long used;
 ?
 } dictht;

table 屬性是一個陣列, 陣列中的每個元素都是一個指向 dict.h/dictEntry 結構的指標, 每個 dictEntry 結構保存著一個鍵值對,

size 屬性記錄了哈希表的大小, 也即是 table 陣列的大小, 而 used 屬性則記錄了哈希表目前已有節點(鍵值對)的數量,

sizemask 屬性的值總是等于 size - 1 , 這個屬性和哈希值一起決定一個鍵應該被放到 table 陣列的哪個索引上面,

哈希表節點

哈希表節點使用 dictEntry 結構表示, 每個 dictEntry 結構都保存著一個鍵值對:

 typedef struct dictEntry {
 ?
     // 鍵
     void *key;
 ?
     // 值
     union {
         void *val;
         uint64_t u64;
         int64_t s64;
    } v;
 ?
     // 指向下個哈希表節點,形成鏈表
     struct dictEntry *next;
 ?
 } dictEntry;

key 屬性保存著鍵值對中的鍵, 而 v 屬性則保存著鍵值對中的值, 其中鍵值對的值可以是一個指標, 或者是一個 uint64_t 整數, 又或者是一個 int64_t 整數,

next 屬性是指向另一個哈希表節點的指標, 這個指標可以將多個哈希值相同的鍵值對連接在一次, 以此來解決鍵沖突(collision)的問題,

舉個例子, 圖 4-2 就展示了如何通過 next 指標, 將兩個索引值相同的鍵 k1k0 連接在一起,

字典

Redis 中的字典由 dict.h/dict 結構表示:

 typedef struct dict {
 ?
     // 型別特定函式
     dictType *type;
 ?
     // 私有資料
     void *privdata;
 ?
     // 哈希表
     dictht ht[2];
 ?
     // rehash 索引
     // 當 rehash 不在進行時,值為 -1
     int rehashidx; /* rehashing not in progress if rehashidx == -1 */
 ?
 } dict;

type 屬性和 privdata 屬性是針對不同型別的鍵值對, 為創建多型字典而設定的:

  • type 屬性是一個指向 dictType 結構的指標, 每個 dictType 結構保存了一簇用于操作特定型別鍵值對的函式, Redis 會為用途不同的字典設定不同的型別特定函式,

  • privdata 屬性則保存了需要傳給那些型別特定函式的可選引數,

 typedef struct dictType {
 ?
     // 計算哈希值的函式
     unsigned int (*hashFunction)(const void *key);
 ?
     // 復制鍵的函式
     void *(*keyDup)(void *privdata, const void *key);
 ?
     // 復制值的函式
     void *(*valDup)(void *privdata, const void *obj);
 ?
     // 對比鍵的函式
     int (*keyCompare)(void *privdata, const void *key1, const void *key2);
 ?
     // 銷毀鍵的函式
     void (*keyDestructor)(void *privdata, void *key);
 ?
     // 銷毀值的函式
     void (*valDestructor)(void *privdata, void *obj);
 ?
 } dictType;

ht 屬性是一個包含兩個項的陣列, 陣列中的每個項都是一個 dictht 哈希表, 一般情況下, 字典只使用 ht[0] 哈希表, ht[1] 哈希表只會在對 ht[0] 哈希表進行 rehash 時使用,

除了 ht[1] 之外, 另一個和 rehash 有關的屬性就是 rehashidx : 它記錄了 rehash 目前的進度, 如果目前沒有在進行 rehash , 那么它的值為 -1

哈希演算法

將新的鍵值插入字典時,程式需要先根據鍵值對的鍵計算出哈希值和索引值,然后根據索引值將新鍵值對所在的哈希表節點放到哈希表陣列對應的索引上面

Redis 計算哈希值和索引值的方法如下:

 # 使用字典設定的哈希函式,計算鍵 key 的哈希值
 hash = dict->type->hashFunction(key);
 ?
 # 使用哈希表的 sizemask 屬性和哈希值,計算出索引值
 # 根據情況不同, ht[x] 可以是 ht[0] 或者 ht[1]
 index = hash & dict->ht[x].sizemask;

解決鍵沖突

當兩個或兩個以上的鍵分配到哈希陣列的同一個索引上時,Redis使用鏈地址法解決鏈沖突

鏈地址法

哈希表節點都有一個next指標,可以使用next指標構成單向鏈表,

且dictEntry節點構成的鏈表沒有指向鏈表末尾的指標,為了節省時間,新的節點一般直接添加到表頭位置

rehash(重新散列)

目的

隨著哈希表鍵值對的逐漸增加或減少,為了讓哈希表的負載因子維持在一定范圍內

步驟

  1. 為字典的 ht[1] 哈希表分配空間,這個哈希表的空間大小取決于要執行的操作, 以及 ht[0] 當前包含的鍵值對數量 (也即是ht[0].used屬性的值):

    • 如果執行的是擴展操作, 那么 ht[1] 的大小為第一個大于等于 ht[0].used * 22^n2n 次方冪);

    • 如果執行的是收縮操作, 那么 ht[1] 的大小為第一個大于等于 ht[0].used2^n

  2. 將保存在 ht[0] 中的所有鍵值對 rehash 到 ht[1] 上面: rehash 指的是重新計算鍵的哈希值和索引值, 然后將鍵值對放置到 ht[1] 哈希表的指定位置上,

  3. ht[0] 包含的所有鍵值對都遷移到了 ht[1] 之后 (ht[0] 變為空表), 釋放 ht[0] , 將 ht[1] 設定為 ht[0] , 并在 ht[1] 新創建一個空白哈希表, 為下一次 rehash 做準備,

哈希表的收縮與擴展

以下條件滿足任意一個時,程式會自動開始對哈希表執行擴展操作:

  1. 服務器目前沒有在執行 BGSAVE 命令或者 BGREWRITEAOF 命令, 并且哈希表的負載因子大于等于 1

  2. 服務器目前正在執行 BGSAVE 命令或者 BGREWRITEAOF 命令, 并且哈希表的負載因子大于等于 5

負載因子計算公式:

 # 負載因子 = 哈希表已保存節點數量 / 哈希表大小
 load_factor = ht[0].used / ht[0].size

 

當哈希表的負載因子小于 0.1 時, 程式自動開始對哈希表執行收縮操作

 

漸進式rehash

目的:

假如哈希表中保存了大量的資料,一次性將這些資料進行rehash時會產生龐大的計算量,為了防止rehash對redis的性能產生影響

漸進式rehash實作的詳細步驟:

  1. ht[1] 分配空間, 讓字典同時持有 ht[0]ht[1] 兩個哈希表,

  2. 在字典中維持一個索引計數器變數 rehashidx , 并將它的值設定為 0 , 表示 rehash 作業正式開始,

  3. 在 rehash 進行期間, 每次對字典執行添加、洗掉、查找或者更新操作時, 程式除了執行指定的操作以外, 還會順帶將 ht[0] 哈希表在 rehashidx 索引上的所有鍵值對 rehash 到 ht[1] , 當 rehash 作業完成之后, 程式將 rehashidx 屬性的值增一,

  4. 隨著字典操作的不斷執行, 最終在某個時間點上, ht[0] 的所有鍵值對都會被 rehash 至 ht[1] , 這時程式將 rehashidx 屬性的值設為 -1 , 表示 rehash 操作已完成,

漸進式rehash執行期間的哈希表操作

  • 字典的刪改查等操作都會在兩個哈希表之間共同進行

  • 新增加的鍵只添加ht[1]

字典API

 

跳躍表

 

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/551003.html

標籤:其他

上一篇:袋鼠云春季生長大會圓滿落幕,帶來數實融合下的新產品、新方案、新實踐!

下一篇:返回列表

標籤雲
其他(157965) Python(38094) JavaScript(25389) Java(17988) C(15215) 區塊鏈(8259) C#(7972) AI(7469) 爪哇(7425) MySQL(7140) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4558) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2430) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1959) Web開發(1951) HtmlCss(1923) python-3.x(1918) 弹簧靴(1913) C++(1910) xml(1889) PostgreSQL(1873) .NETCore(1854) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • 《Redis設計與實作》讀書筆記

    《Redis設計與實作》讀書筆記 簡單動態字串 SDS的定義 結構: buf陣列:用于保存字串 len屬性:記錄SDS中保存字串的長度 free屬性:記錄buf中未使用位元組數量 遵循C字串以空字串結尾的慣例,保存空字串的位元組不計入長度 SDS與C字串的區別 常數復雜度獲取字串長度 因 ......

    uj5u.com 2023-04-24 09:01:39 more
  • 袋鼠云春季生長大會圓滿落幕,帶來數實融合下的新產品、新方案、新

    4月20日,以“數實融合,韌性生長”為主題的袋鼠云春季生長大會圓滿落幕。 在春季生長大會中,袋鼠云帶來了數實融合趨勢下的最新行業沉淀、最佳實踐經驗和行業前瞻性的產品發布。從大資料基礎軟體“數堆疊”、到低代碼數字孿生世界“易知微”,再到可觀測運維專家“云掣”,為廣大用戶帶來了一場場精彩內容,共話數字未來 ......

    uj5u.com 2023-04-24 09:00:57 more
  • 無懼百萬級并發,GaussDB(for Cassandra)讓華為推送服務更快觸達

    摘要:推送服務(Push Kit)是華為提供的訊息推送平臺,建立了從云端到終端的訊息推送通道。通過集成推送服務,您可以向客戶端應用實時推送訊息,讓應用更精準觸達用戶,是開發者提升用戶感知度和活躍度的一件利器。 本文分享自華為云社區《無懼百萬級并發,GaussDB(for Cassandra)讓華為P ......

    uj5u.com 2023-04-24 09:00:33 more
  • mysql+proxysql+replication-manager的主從半同步復制+高可用+讀

    環境: AlmaLinux release 9.1 MySQL Community Server Ver 8.0.33 Replication Manager v2.2.40 for MariaDB 10.x and MySQL 5.7 Series ProxySQL version 2.5.1-9 ......

    uj5u.com 2023-04-24 09:00:18 more
  • 華為云GaussDB支撐華為MetaERP系統全面替換

    摘要:目前MetaERP已經覆寫了華為公司100%的業務場景和80%的業務量。 本文分享自華為云社區《強渡大渡河!華為云GaussDB支撐華為MetaERP系統全面替換》,作者: 華為云頭條。 近日,在“英雄強渡大渡河”MetaERP表彰會上,華為宣布實作自主可控的MetaERP研發,并完成對舊ER ......

    uj5u.com 2023-04-24 09:00:07 more
  • 詳解Redis三大集群模式,輕松實作高可用!

    Redis集群是一種通過將多個Redis節點連接在一起以實作高可用性、資料分片和負載均衡的技術。它允許Redis在不同節點上同時提供服務,提高整體性能和可靠性。根據搭建的方式和集群的特性,Redis集群主要有三種模式:主從復制模式(Master-Slave)、哨兵模式(Sentinel)和Clust... ......

    uj5u.com 2023-04-24 08:59:53 more
  • MySQL 移動資料目錄后啟動失敗

    GreatSQL社區原創內容未經授權不得隨意使用,轉載請聯系小編并注明來源。 GreatSQL是MySQL的國產分支版本,使用上與MySQL一致。 作者: 王權富貴 文章來源:GreatSQL社區投稿 背景概述 由于安裝資料庫時將MySQL的資料目錄放在了根目錄下,現在存盤空間不足,想通過mv將資料 ......

    uj5u.com 2023-04-24 08:59:20 more
  • 無懼百萬級并發,GaussDB(for Cassandra)讓華為推送服務更快觸達

    摘要:推送服務(Push Kit)是華為提供的訊息推送平臺,建立了從云端到終端的訊息推送通道。通過集成推送服務,您可以向客戶端應用實時推送訊息,讓應用更精準觸達用戶,是開發者提升用戶感知度和活躍度的一件利器。 本文分享自華為云社區《無懼百萬級并發,GaussDB(for Cassandra)讓華為P ......

    uj5u.com 2023-04-24 08:58:55 more
  • 華為云GaussDB支撐華為MetaERP系統全面替換

    摘要:目前MetaERP已經覆寫了華為公司100%的業務場景和80%的業務量。 本文分享自華為云社區《強渡大渡河!華為云GaussDB支撐華為MetaERP系統全面替換》,作者: 華為云頭條。 近日,在“英雄強渡大渡河”MetaERP表彰會上,華為宣布實作自主可控的MetaERP研發,并完成對舊ER ......

    uj5u.com 2023-04-24 08:58:45 more
  • 輕松拿下PostgreSQL,這30個實用SQL陳述句你細品

    PostgreSQL是一款功能非常強大的開源關系型資料庫,它支持哈希索引、反向索引、部分索引、Expression 索引、GiST、GIN等多種索引模式,同時可安裝功能豐富的擴展包。相較于Mysql,PostgreSQ支持通過PostGIS擴展支持地理空間資料、支持嵌套回圈,哈希連接,排序合并三種表... ......

    uj5u.com 2023-04-24 08:58:30 more