主頁 > .NET開發 > 聊一聊redis十種資料型別及底層原理

聊一聊redis十種資料型別及底層原理

2023-05-10 10:03:30 .NET開發

概述

Redis 是一個開源的高性能鍵值資料庫,它支持多種資料型別,可以滿足不同的業務需求,本文將介紹 Redis 的10種資料型別,分別是

  • string(字串)
  • hash(哈希)
  • list(串列)
  • set(集合)
  • zset(有序集合)
  • stream(流)
  • geospatial(地理)
  • bitmap(位圖)
  • bitfield(位域)
  • hyperloglog(基數統計)

String

概述

string 是 Redis 最基本的資料型別,它可以存盤任意型別的資料,比如文本、數字、圖片或者序列化的物件,一個 string 型別的鍵最大可以存盤 512 MB 的資料,

string 型別的底層實作是 SDS(simple dynamic string),它是一個動態字串結構,由長度、空閑空間和位元組陣列三部分組成,SDS有3種編碼型別:

  • embstr:占用64Bytes的空間,存盤44Bytes的資料
  • raw:存盤大于44Bytes的資料
  • int:存盤整數型別

embstr和raw存盤字串資料,int存盤整型資料

應用場景

string 型別的應用場景非常廣泛,比如:

  • 快取資料,提高訪問速度和降低資料庫壓力,
  • 計數器,利用 incr 和 decr 命令實作原子性的加減操作,
  • 分布式鎖,利用 setnx 命令實作互斥訪問,
  • 限流,利用 expire 命令實作時間視窗內的訪問控制,

底層原理

embstr結構

embstr 結構存盤小于等于44個位元組的字串,embstr 每次開辟64個byte的空間

  • 前19個byte用于存盤embstr 結構
  • 中間的44個byte存盤資料
  • 最后為\0符號
    image

raw結構

image

embstr和raw的轉換

在存盤字串的時候,redis會根據資料的長度判斷使用哪種結構

  • 如果長度小于等于44個位元組,就會選擇embstr 結構
  • 如果長度大于44個byte,就會選擇raw結構
    image
127.0.0.1:6379> object encoding str
"embstr"
# str賦值44個位元組的字串
127.0.0.1:6379> set str 1234567890123456789012345678901234567890abcd
OK
127.0.0.1:6379> object encoding str
"embstr"
# str2賦值45個位元組的字串
127.0.0.1:6379> set str2 1234567890123456789012345678901234567890abcde
OK
127.0.0.1:6379> object encoding str2
"raw"
127.0.0.1:6379> set num 123
OK
127.0.0.1:6379> object encoding num
"int"

Hash

概述

hash 是一個鍵值對集合,它可以存盤多個欄位和值,類似于編程語言中的 map 物件,一個 hash 型別的鍵最多可以存盤 2^32 - 1 個欄位,

Hash型別的底層實作有三種:

  • ziplist:壓縮串列,當hash達到一定的閾值時,會自動轉換為hashtable結構
  • listpack:緊湊串列,在Redis7.0之后,listpack正式取代ziplist,同樣的,當hash達到一定的閾值時,會自動轉換為hashtable結構
  • hashtable:哈希表,類似map

應用場景

hash 型別的應用場景主要是存盤物件,比如:

  • 用戶資訊,利用 hset 和 hget 命令實作物件屬性的增刪改查,
  • 購物車,利用 hincrby 命令實作商品數量的增減,
  • 配置資訊,利用 hmset 和 hmget 命令實作批量設定和獲取配置項,

底層原理

Redis在存盤hash結構的資料,為了達到記憶體和性能的平衡,也針對少量存盤和大量存盤分別設計了兩種結構,分別為:

  • ziplist(redis7.0之前使用)和listpack(redis7.0之后使用)
  • hashTable

ziplist/listpack編碼轉換為hashTable編碼是通過判斷元素數量單個元素Key或Value的長度決定的:

  • hash-max-ziplist-entries:表示當hash中的元素數量小于或等于該值時,使用ziplist編碼,否則使用hashtable編碼,ziplist是一種壓縮串列,它可以節省記憶體空間,但是訪問速度較慢,hashtable是一種哈希表,它可以提高訪問速度,但是占用記憶體空間較多,默認值為512
  • hash-max-ziplist-value:表示當 hash中的每個元素的 key value 的長度都小于或等于該值時,使用 ziplist編碼,否則使用 hashtable編碼,默認值為 64

ziplist與listpack

ziplist/listpack都是hash結構用來存盤少量資料的結構,從Redis7.0后,hash默認使用ziplist結構,因為 ziplist有一個致命的缺陷,就是連鎖更新,當一個節點的長度發生變化時,可能會導致后續所有節點的長度欄位都要重新編碼,這會造成極差的性能

ziplist結構

ziplist是一種緊湊的鏈表結構,它將所有的欄位和值順序地存盤在一塊連續的記憶體中,
image
Redis中ziplist原始碼

typedef struct {
  /* 當使用字串時,slen表示為字串長度 */
  unsigned char *sval;
  unsigned int slen;
  /* 當使用整形時,sval為NULL,lval為ziplistEntry的value */
  long long lval;
} ziplistEntry;

listpack結構

image

zipList的連鎖更新問題

ziplist的每個entry都包含previous_entry_length來記錄上一個節點的大小,長度是1個或5個byte:

  • 如果前一節點的長度小于254個byte,則采用1個byte來保存這個長度值
  • 如果前一節點的長度大于等于254個byte,則采用5個byte來保存這個長度值,第一個byte為0xfe,后四個byte才是真實長度資料

假設,現有有N個連續、長度為250~253個byte的entry,因此entry的previous_entry_length屬性占用1個btye

image

當第一節長度大于等于254個bytes,導致第二節previous_entry_length變為5個bytes,第二節的長度由250變為254,而第二節長度的增加必然會影響第三節的previous_entry_length,ziplist這種特殊套娃的情況下產生的連續多次空間擴展操作成為連鎖更新,新增、洗掉都可能導致連鎖更新的產生,

listpack是如何解決的

image

  1. 由于ziplist需要倒著遍歷,所以需要用previous_entry_length記錄前一個entry的長度,而listpack可以通過total_bytes和end計算出來,所以previous_entry_length不需要了,
  2. listpack 的設計徹底消滅了 ziplist 存在的級聯更新行為,元素與元素之間完全獨立,不會因為一個元素的長度變長就導致后續的元素內容會受到影響,
  3. 與ziplist做對比的話,犧牲了記憶體使用率,避免了連鎖更新的情況,從代碼復雜度上看,listpack相對ziplist簡單很多,再把增刪改統一做處理,從listpack的代碼實作上看,極簡且高效,

hashTable

hashTable是一種散串列結構,它將欄位和值分別存盤在兩個陣列中,并通過哈希函式計算欄位在陣列中的索引

image

Redis中hashTable原始碼

struct dict {
    dictType *type;
    dictEntry **ht_table[2];
    unsigned long ht_used[2];
    long rehashidx; /* 當進行rehash時,rehashidx為-1 */
    int16_t pauserehash; /* 如果rehash暫停,pauserehash則大于0,(小于0表示代碼錯誤)*/
    signed char ht_size_exp[2]; /* 哈希桶的個數(size = 1<<exp) */
};

typedef struct dict {
    dictEntry **table;
    dictType *type;
    unsigned long size;
    unsigned long sizemask;
    unsigned long used;
    void *privdata;
} dict;

typedef struct dictEntry {
    void *key;
    void *val;
    struct dictEntry *next;
} dictEntry;

ziplist和hashTable的轉換

image

127.0.0.1:6379> hset h1 id 123456789012345678901234567890123456789012345678901234567890abcd
(integer) 1
127.0.0.1:6379> object encoding h1
"ziplist"
127.0.0.1:6379> hset h2 id 123456789012345678901234567890123456789012345678901234567890abcde
(integer) 1
127.0.0.1:6379> object encoding h2
"hashtable"

ziplist的廢棄

顯然是ziplist在field個數太大、key太長、value太長三者有其一的時候會有以下問題:

  1. ziplist每次插入都有開辟空間,連續的
  2. 查詢的時候,需要從頭開始計算,查詢速度變慢

hashTable變得越來越長怎么辦

擴容,hashTabel是怎么擴容的?使用的是漸進式擴容rehashrehash會重新計算哈希值,且將哈希桶的容量擴大,

rehash 步驟

image

擴展哈希和收縮哈希都是通過執行rehash來完成,這其中就涉及到了空間的分配和釋放,主要經過以下五步:

  1. 為字典dict的ht[1]哈希表分配空間,其大小取決于當前哈希表已保存節點數(即:ht[0].used):
    • 如果是擴展操作則ht[1]的大小為2的n次方中第一個大于等于ht[0].used * 2屬性的值(比如used=3,此時ht[0].used * 2=6,故2的3次方為8就是第一個大于used * 2的值(2 的 2 次方 6)),
    • 如果是收縮操作則ht[1]大小為 2 的 n 次方中第一個大于等于ht[0].used的值
  2. 將字典中的屬性rehashidx的值設定為0,表示正在執行rehash操作
  3. 將ht[0]中所有的鍵值對依次重新計算哈希值,并放到ht[1]陣列對應位置,每完成一個鍵值對的rehash之后rehashidx的值需要自增1
  4. 當ht[0]中所有的鍵值對都遷移到ht[1]之后,釋放ht[0],并將ht[1]修改為ht[0],然后再創建一個新的ht[1]陣列,為下一次rehash做準備
  5. 將字典中的屬性rehashidx設定為-1,表示此次rehash操作結束,等待下一次rehash

漸進式 rehash

Redis中的這種重新哈希的操作因為不是一次性全部rehash,而是分多次來慢慢的將ht[0]中的鍵值對rehash到ht[1],故而這種操作也稱之為漸進式rehash,漸進式rehash可以避免集中式rehash帶來的龐大計算量,是一種分而治之的思想,

在漸進式rehash程序中,因為還可能會有新的鍵值對存進來,此時Redis的做法是新添加的鍵值對統一放入ht[1]中,這樣就確保了ht[0]鍵值對的數量只會減少,

當正在執行rehash操作時,如果服務器收到來自客戶端的命令請求操作,則會先查詢ht[0],查找不到結果再到ht[1]中查詢

List

概述

list 是一個有序的字串串列,它按照插入順序排序,并且支持在兩端插入或洗掉元素,一個 list 型別的鍵最多可以存盤 2^32 - 1 個元素,

redis3.2以后,list 型別的底層實作只有一種結構,就是quicklist,版本不同時,底層實作是不同的,下面會講解,

應用場景

list 型別的應用場景主要是實作佇列和堆疊,比如:

  • 訊息佇列,利用 lpush 和 rpop 命令實作生產者消費者模式,
  • 最新訊息,利用 lpush 和 ltrim 命令實作固定長度的時間線,
  • 歷史記錄,利用 lpush 和 lrange 命令實作瀏覽記錄或者搜索記錄,

底層原理

在講解list結構之前,需要先說明一下list結構編碼的更替,如下

  • Redis3.2之前,list使用的是linkedlistziplist
  • Redis3.2~Redis7.0之間,list使用的是quickList,是linkedlistziplist的結合
  • Redis7.0之后,list使用的也是quickList,只不過將ziplist轉為listpack,它是listpack、linkedlist結合版

linkedlist與ziplist

Redis3.2之前,linkedlistziplist兩種編碼可以選擇切換,它們之間的轉換關系如圖
image

同樣地,ziplist轉為linkedlist的條件可在redis.conf配置

list-max-ziplist-entries 512
list-max-ziplist-value 64

quickList(ziplist、linkedlist結合版)

quicklist存盤了一個雙向串列,每個串列的節點是一個ziplist,所以實際上quicklist并不是一個新的資料結構,它就是linkedlistziplist的結合,然后被命名為快速串列,
image
ziplist內部entry個數可在redis.conf配置

list-max-ziplist-size -2
# -5: 每個ziplist最多為 64 kb  <-- 影響正常負載,不推薦
# -4: 每個ziplist最多為 32 Kb  <-- 不推薦
# -3: 每個ziplist最多為 16 Kb  <-- 最好不要使用
# -2: 每個ziplist最多為 8 Kb   <-- 好
# -1: 每個ziplist最多為 4 Kb   <-- 好
# 正數為ziplist內部entry個數

ziplist通過特定的LZF壓縮演算法來將節點進行壓縮存盤,從而更進一步的節省空間,而很多場景都是兩端元素訪問率最高,我們可以通過配置list-compress-depth來排除首尾兩端不壓縮的entry個數,

list-compress-depth 0
# - 0:不壓縮(默認值)
# - 1:首尾第 1 個元素不壓縮
# - 2:首位前 2 個元素不壓縮
# - 3:首尾前 3 個元素不壓縮
# - 以此類推

quickList(listpack、linkedlist結合版)

和Hash結構一樣,因為ziplist有連鎖更新問題,redis7.0ziplist替換為listpack,下面是新quickList的結構圖

image

Redis中listpack原始碼

typedef struct quicklist {
    quicklistNode *head;
    quicklistNode *tail;
    unsigned long count;        /* 所有串列包中所有條目的總數,占用16 bits,最大65536 */
    unsigned long len;          /* quicklistNode 的數量 */
    signed int fill : QL_FILL_BITS;       /* 單個節點的填充因子 */
    unsigned int compress : QL_COMP_BITS; /* 不壓縮的端節點深度;0=off */
    unsigned int bookmark_count: QL_BM_BITS;
    quicklistBookmark bookmarks[];
} quicklist;
typedef struct quicklistNode {
    struct quicklistNode *prev;
    struct quicklistNode *next;
    unsigned char *entry;
    size_t sz;             /* 當前entry占用位元組 */
    unsigned int count : 16;     /* listpack元素個數,最大65535 */
    unsigned int encoding : 2;   /* RAW==1 or LZF==2 */
    unsigned int container : 2;  /* PLAIN==1 or PACKED==2 */
    unsigned int recompress : 1; /* 當前listpack是否需要再次壓縮 */
    unsigned int attempted_compress : 1; /* 測驗用 */
    unsigned int extra : 10; /* 備用 */
} quicklistNode;

listpack內部entry個數可在redis.conf配置

List-Max-listpack-size -2
# -5: 每個listpack最多為 64 kb  <-- 影響正常負載,不推薦
# -4: 每個listpack最多為 32 Kb  <-- 不推薦
# -3: 每個listpack最多為 16 Kb  <-- 最好不要使用
# -2: 每個listpack最多為 8 Kb   <-- 好
# -1: 每個listpack最多為 4 Kb   <-- 好
# 正數為listpack內部entry個數

Set

概述

set 是一個無序的字串集合,它不允許重復的元素,一個 set 型別的鍵最多可以存盤 2^32 - 1 個元素,

set 型別的底層實作有兩種:

  • intset,整數集合
  • hashtable(哈希表),哈希表和 hash 型別的哈希表相同,它將元素存盤在一個陣列中,并通過哈希函式計算元素在陣列中的索引

Redis 會根據 set 中元素的數量和型別來選擇合適的編碼方式,當 set 達到一定的閾值時,會自動轉換編碼方式,


typedef struct intset {
    uint32_t encoding;
    uint32_t length;
    int8_t contents[];
} intset;

應用場景

set 型別的應用場景主要是利用集合的特性,比如:

  • 去重,利用 sadd 和 scard 命令實作元素的添加和計數,
  • 交集,并集,差集,利用 sinter,sunion 和 sdiff 命令實作集合間的運算,
  • 隨機抽取,利用 srandmember 命令實作隨機抽獎或者抽樣,

底層原理

在講解set結構之前,需要先說明一下set結構編碼的更替,如下

  • Redis7.2之前,set使用的是intsethashtable
  • Redis7.2之后,set使用的是intsetlistpackhashtable

intset

intset是一種緊湊的陣列結構,它只保存int型別的資料,它將所有的元素按照從小到大的順序存盤在一塊連續的記憶體中,intset會根據傳入的資料大小,encoding分為int16_tint32_tint64_t
image

127.0.0.1:6379> sadd set 123
(integer) 1
127.0.0.1:6379> object encoding set
"intset"
127.0.0.1:6379> sadd set abcd
(integer) 1
127.0.0.1:6379> object encoding set
"hashtable"

intset 和 hashtable 的轉換

Redis7.2之前,當一個集合滿足以下兩個條件時,Redis 會選擇使用intset編碼:

  • 集合物件保存的所有元素都是整數值
  • 集合物件保存的元素數量小于等于512個(默認)

intset最大元素數量可在redis.conf配置

set-max-intset-entries 512

為什么加入了listpack

redis7.2之前,sds型別的資料會直接放入到編碼結構式為hashtableset中,其中,sds其實就是redis中的string型別,

而在redis7.2之后,sds型別的資料,首先會使用listpack結構當 set 達到一定的閾值時,才會自動轉換為hashtable

添加listpack結構是為了提高記憶體利用率和操作效率,因為 hashtable 的空間開銷和碰撞概率都比較高,

hashtable 的空間開銷高

hashtable 的空間開銷高是因為它需要預先分配一個固定大小的陣列來存盤鍵值對,而這個陣列的大小通常要大于實際存盤的元素個數,以保證較低的裝載因子,裝載因子是指 hashtable 中已經存盤的元素個數和陣列大小的比值,它反映了 hashtable 的空間利用率

  • 如果裝載因子過高,那么 hashtable 的性能會下降,因為碰撞的概率會增加
  • 如果裝載因子過低,那么 hashtable 的空間利用率會下降,因為陣列中會有很多空閑的位置

因此,hashtable 需要在裝載因子和空間利用率之間做一個平衡,通常裝載因子的推薦值是 0.75

hashtable 的碰撞概率高

hashtable碰撞概率高是因為它使用了一個散列函式來將任意長度的鍵映射到一個有限范圍內的整數,作為陣列的索引

散列函式的設計很重要,它應該盡可能地保證不同的鍵能夠均勻地分布在陣列中,避免出現某些位置過于擁擠,而其他位置過于稀疏的情況,然而,由于散列函式的輸出范圍是有限的,而鍵的取值范圍是無限的,所以不可能完全避免兩個不同的鍵被散列到同一個位置上,這就產生了碰撞,碰撞會影響 hashtable 的性能,因為它需要額外的處理方式來解決沖突,比如開放尋址法或者鏈地址法

舉例說明,假設有一個大小為8的hashtable,使用取模運算作為散列函式,即h(k) = k mod 8,現在有四個鍵:5,13,21,29,它們都被散列到索引1

image

這就是一個碰撞的例子,因為四個鍵都映射到了同一個索引,這種情況可能是由于以下原因造成的:

  • 散列函式的選擇不合適,沒有充分利用hashtable的空間,
  • 鍵的分布不均勻,有些區間的鍵出現的頻率更高,
  • hashtable的大小太小,不能容納所有的鍵,

為了解決碰撞,redis采用了鏈地址法,就是在每個索引處維護一個鏈表,存盤所有散列到該索引的鍵,但是,如果鏈表過長,查找效率會降低,因此,一般建議保持hashtable的負載因子(即鍵的數量除以hashtable的大小)在一定范圍內,比如0.5到0.75之間,如果負載因子過高或過低,可以通過擴容或縮容來調整hashtable的大小

intset 、listpack和hashtable的轉換

intset 、listpack和hashtable這三者的轉換時根據要添加的資料、當前set的編碼和閾值決定的,

  • 如果要添加的資料是整型,且當前set的編碼為intset,如果超過閾值由intset直接轉為hashtable

    閾值條件為:
    set-max-intset-entriesintset最大元素個數,默認512

  • 如果要添加的資料是字串,分為三種情況

    • 當前set的編碼為intset:如果沒有超過閾值,轉換為listpack;否則,直接轉換為hashtable
    • 當前set的編碼為listpack:如果超過閾值,就轉換為hashtable
    • 當前set的編碼為hashtable:直接插入,編碼不會進行轉換

    閾值條件為:
    set-max-listpack-entries:最大元素個數,默認128
    set_max_listpack_value:最大元素大小,默認64
    以上兩個條件需要同時滿足才能進行編碼轉換

ZSet

概述

Redis 中的 zset 是一種有序集合型別,它可以存盤不重復的字串元素,并且給每個元素賦予一個排序權重值(score),Redis 通過權重值來為集合中的元素進行從小到大的排序,zset 的成員是唯一的,但權重值可以重復,一個 zset 型別的鍵最多可以存盤 2^32 - 1 個元素,

Redis中zset原始碼

typedef struct zskiplistNode {
    sds ele;
    double score;
    struct zskiplistNode *backward;
    struct zskiplistLevel {
        struct zskiplistNode *forward;
        unsigned long span;
    } level[];
} zskiplistNode;

typedef struct zskiplist {
    struct zskiplistNode *header, *tail;
    unsigned long length;
    int level;
} zskiplist;

typedef struct zset {
    dict *dict;
    zskiplist *zsl;
} zset;

應用場景

zset 型別的應用場景主要是利用分數和排序的特性,比如:

  • 排行榜,利用 zadd 和 zrange 命令實作分數的更新和排名的查詢
  • 延時佇列,利用 zadd 和 zpopmin 命令實作任務的添加和執行,并且可以定期地獲取已經到期的任務
  • 訪問統計,可以使用 zset 來存盤網站或者文章的訪問次數,并且可以按照訪問量進行排序和篩選,

底層原理

Redis在存盤zset結構的資料,為了達到記憶體和性能的平衡,針對少量存盤和大量存盤分別設計了兩種結構,分別為:

  • ziplistredis7.0之前使用)和listpack(redis7.0之后使用)
  • skiplist

zset 中的元素個數和元素值的長度比較小的時候,Redis 使用ziplist/listpack來節省記憶體空間,當 zset 中的元素個數和元素值的長度達到一定閾值時,Redis 會自動將ziplist/listpack轉換為skiplist,以提高操作效率

具體來說,當 zset 同時滿足以下兩個條件時,會使用 listpack作為底層結構:

  • 元素個數小于 zset_max_listpack_entries ,默認值為 128
  • 元素值的長度小于zset_max_listpack_value,默認值為 64

zset 中不滿足以上兩個條件時,會使用 skiplist 作為底層結構,

skiplist

跳躍表是一種隨機化的資料結構,實質就是一種可以進行二分查找的有序鏈表,跳躍表在原有的有序鏈表上面增加了多級索引,通過索引來實作快速查找,跳躍表不僅能提高搜索性能,同時也可以提高插入和洗掉操作的性能

image

跳躍表相比于其他平衡樹結構,有以下幾個優點和缺點:

優點:

  • 實作簡單,易于理解和除錯
  • 插入和洗掉操作只需要修改區域節點的指標,不需要像平衡樹那樣進行全域調整
  • 可以利用空間換時間,通過增加索引層來提高查找效率
  • 支持快速的范圍查詢,可以方便地回傳指定區間內的所有元素

缺點:

  • 空間復雜度較高,需要額外存盤多級索引
  • 隨機性太強,性能不穩定,最壞情況下可能退化成鏈表
  • 不支持快速的倒序遍歷,需要額外的指標來實作

redis的skiplist

skiplist有一個層數上的問題,當層數過多,會影響查詢效率,而Redis 使用了一個隨機函式來決定每個節點的層數,這個隨機函式的期望值是 1/(1-p) ,其中 p 是一個概率常數,Redis 中默認為 0.25,這樣可以保證跳躍表的平均高度為 log (1/p) n ,其中 n 是節點數,Redis 還限制了跳躍表的最大層數為 32 ,這樣可以避免過高的索引層造成空間浪費

Stream

概述

stream 是一個類似于日志的資料結構,它可以記錄一系列的鍵值對,每個鍵值對都有一個唯一的 ID,一個 stream 型別的鍵最多可以存盤 2^64 - 1 個鍵值對,

stream 型別的底層實作是 rax(基數樹),它是一種壓縮的前綴樹結構,它將所有的鍵值對按照 ID 的字典序存盤在一個樹形結構中,rax 可以快速地定位、插入、洗掉任意位置的鍵值對

應用場景

stream 型別的應用場景主要是實作事件驅動的架構,比如:

  • 訊息佇列,利用 xadd 和 xread 命令實作生產者消費者模式,
  • 操作日志,利用 xadd 和 xrange 命令實作操作記錄和回放,
  • 資料同步,利用 xadd 和 xreadgroup 命令實作多個消費者組之間的資料同步,

底層原理

Rax Tree

rax tree是一種基于基數樹(radix tree)的變體,也叫做壓縮前綴樹(compressed prefix tree),它被應用于redis stream中,用來存盤streamID,其資料結構為

typedef struct raxNode {
    uint32_t iskey:1;     /* Does this node contain a key? */
    uint32_t isnull:1;    /* Associated value is NULL (don't store it). */
    uint32_t iscompr:1;   /* 前綴是否壓縮 */
    uint32_t size:29;     /* Number of children, or compressed string len. */
    unsigned char data[];
} raxNode;
  • iskey:是否包含key
  • isnull:是否存盤value值
  • iscompr:前綴是否壓縮,決定了size存盤的是什么和data的資料結構
  • size
    • iscompr=0:節點為非壓縮節點size是孩子節點的數量
    • iscompr=1:節點為壓縮節點size是已壓縮的字串長度
  • data
    • iscompr=0:節點為非壓縮節點,資料格式為[header strlen=0][abc][a-ptr][b-ptr][c-ptr](value-ptr?),其有size個字符,
    • iscompr=1:節點為壓縮節點,資料格式為[header strlen=3][xyz][z-ptr](value-ptr?)

為了便于理解,設定一些場景舉例說明

場景一:只插入foot

資料結構為:

image

其中,z-ptr指向的葉子節點的iskey=1,標識foot這個key,下圖為使用樹狀圖的形式來展現其資料結構
image

場景二:插入foot后,插入footer

資料結構為:

image

其插入程序為:

  1. foot節點中每個字符進行比較,獲得最大公共前綴foot
  2. er作為foot的子節點,其iskey=1,標識foot這個key
  3. er的子節點的iskey=1,標識footer這個key

下圖為使用樹狀圖的形式來展現其資料結構
image

場景三:插入foot后,插入fo

資料結構為:

image

其插入程序為:

  1. foot節點中每個字符進行比較,獲得最大公共前綴fo
  2. foot拆成foot
  3. ot作為fo的子節點,其iskey=1,標識fo這個key
  4. 設定ot的子節點的iskey=1,標識foot這個key

下圖為使用樹狀圖的形式來展現其資料結構
image

場景四:插入foot后,插入foobar

資料結構為:

image

其插入程序為:

  1. foot節點中每個字符進行比較,獲得最大公共前綴foo
  2. foot拆成foot
  3. footbar拆成foobar
  4. tb作為foo的子節點
  5. 設定ot的子節點的iskey=1,標識foot這個key
  6. ar作為b的子節點
  7. 設定ar的子節點的iskey=1,標識footbar這個key

下圖為使用樹狀圖的形式來展現其資料結構
image

Stream

stream的底層使用了rax treelistpack兩種結構,rax tree用來存盤streamID,而listpack用來存盤對應的值,結構圖如下:

image

Hyperloglog

概述

HyperLogLog 是一種概率資料結構,用于在恒定的記憶體大小下估計集合的基數(不同元素的個數),它不是一個獨立的資料型別,而是一種特殊的 string 型別,它可以使用極小的空間來統計一個集合中不同元素的數量,也就是基數,一個 hyperloglog 型別的鍵最多可以存盤 12 KB 的資料

hyperloglog 型別的底層實作是 SDS(simple dynamic string),它和 string 型別相同,只是在操作時會使用一種概率演算法來計算基數,hyperloglog 的誤差率為 0.81%,也就是說如果真實基數為 1000,那么 hyperloglog 計算出來的基數可能在 981 到 1019 之間

應用場景

hyperloglog 型別的應用場景主要是利用空間換時間和精度,比如:

  • 統計網站的獨立訪客數(UV)
  • 統計在線游戲的活躍用戶數(DAU)
  • 統計電商平臺的商品瀏覽量
  • 統計社交網路的用戶關注數
  • 統計日志分析中的不同事件數

假如需要統計某商品的用戶關注數,可以通過以下方式:

> PFADD goodA "1"
1
> PFADD goodA "2"
1
> PFADD goodA "3"
1
> PFCOUNT goodA
3

GEO

概述

geospatial 是一種用于存盤和查詢地理空間位置的資料型別,它基于 sorted set 資料結構實作,利用 geohash 演算法將經緯度編碼為二進制字串,并作為 sorted set 的 score 值,Redis geospatial 提供了一系列的命令來添加、洗掉、搜索和計算地理空間位置,例如:

  • GEOADD key longitude latitude member [longitude latitude member …]:將一個或多個地理空間位置(經度、緯度、名稱)添加到指定的 key 中

  • GEOPOS key member [member …]:回傳一個或多個地理空間位置的經緯度

  • GEODIST key member1 member2 [unit]:回傳兩個地理空間位置之間的距離,可以指定單位(m, km, mi, ft)

  • GEORADIUS key longitude latitude radius unit [WITHCOORD] [WITHDIST] [WITHHASH] [COUNT count] [ASC|DESC] [STORE key] [STOREDIST key]:回傳指定圓心和半徑內的地理空間位置,可以指定回傳坐標、距離、哈希值、數量、排序方式等,也可以將結果存盤到另一個 key 中

  • GEORADIUSBYMEMBER key member radius unit [WITHCOORD] [WITHDIST] [WITHHASH] [COUNT count] [ASC|DESC] [STORE key] [STOREDIST key]: 回傳以指定成員為圓心的指定半徑內的地理空間位置,其他引數同 GEORADIUS

應用場景

geospatial 的應用是地理位置搜索、分析和展示,例如地圖應用、導航應用、位置服務應用等,例如,可以使用 geospatial 來實作以下功能:

  • 統計某個區域內的商家或用戶數量
  • 查詢某個位置附近的餐館或酒店
  • 計算兩個位置之間的距離或行駛時間
  • 顯示某個位置周圍的景點或活動

Bitmap

概述

bitmap 不是一個獨立的資料型別,而是一種特殊的 string 型別,它可以將一個 string 型別的值看作是一個由二進制位組成的陣列,并提供了一系列操作二進制位的命令,一個 bitmap 型別的鍵最多可以存盤 2^32 - 1 個二進制位,

bitmap 型別的底層實作是 SDS(simple dynamic string),它和 string 型別相同,只是在操作時會將每個位元組拆分成 8 個二進制位,

應用場景

bitmap 型別的應用場景主要是利用二進制位的特性,比如:

  • 統計用戶活躍度,利用 setbit 和 bitcount 命令實作每天或每月用戶登錄次數的統計,
  • 實作布隆過濾器,利用 setbit 和 getbit 命令實作快速判斷一個元素是否存在于一個集合中,
  • 實作位圖索引,利用 bitop 和 bitpos 命令實作對多個條件進行位運算和定位

假如需要統計每個用戶的當天登錄次數統計,

首先,需要規定bitmap的格式,假設為{userid}:{年份}:{第幾天} {秒數} {是否登錄}

userid為100的用戶,記錄他在2024年第100天中第1秒,是否登錄

SETBIT 1000:2024:100 1 1
0

userid為100的用戶,記錄他在2024年第100天中第10240 秒,是否登錄

SETBIT 1000:2024:100 10240 1
0

userid為100的用戶,記錄他在2024年第100天中第86400 秒,是否登錄

SETBIT 1000:2024:100 86400 1
0

統計userid為100的用戶,在2024年第100天的登錄次數

BITCOUNT 1000:2024:100
3

Bitfield

概述

bitfield結構是基于字串型別的一種擴展,可以讓你對一個字串中的任意位進行設定,增加和獲取操作,就像一個位陣列一樣

可以操作任意位長度的整數,從無符號的1位整數有符號的63位整數,這些值是使用二進制編碼的Redis字串來存盤的

bitfield結構支持原子的讀,寫和增加操作,使它們成為管理計數器和類似數值的好選擇

使用場景

Bitfield的使用場景與bitmap 類似,主要是一些需要用不同位長度的整數來表示狀態或屬性的場合,例如:

  • 用一個32位的無符號整數來表示用戶的金幣數量,用一個32位的無符號整數來表示用戶殺死的怪物數量,可以方便地對這些數值進行設定,增加和獲取

  • 用一個16位的有符號整數來表示用戶的等級,用一個16位的有符號整數來表示用戶的經驗值,可以方便地對這些數值進行設定,增加和獲取

  • 用一個8位的無符號整數來表示用戶的性別,用一個8位的無符號整數來表示用戶的年齡,可以方便地對這些數值進行設定,增加和獲取

bitfieldbitmap都是基于string型別的位操作,但是有一些區別:

  • bitmap只能操作1位的無符號整數,而bitfield可以操作任意位長度的有符號或無符號整數
  • bitmap只能設定或獲取指定偏移量上的位,而bitfield可以對指定偏移量上的位進行增加或減少操作
  • bitmap可以對多個字串進行位運算,而bitfield只能對單個字串進行位操作
  • bitmap的偏移量是從0開始的,而bitfield的偏移量是從最高有效位開始的

例如,使用bitfield存盤用戶的個人資訊,

  • 用一個8位的無符號整數來表示用戶的性別,0表示男,1表示女
  • 用一個8位的無符號整數來表示用戶的年齡,范圍是0-255
  • 用一個16位的無符號整數來表示用戶的身高,單位是厘米,范圍是0-65535
  • 用一個16位的無符號整數來表示用戶的體重,單位是克,范圍是0-65535

假設有一個用戶,性別是女,年齡是25,身高是165厘米,體重是50千克,可以用以下命令來存盤和獲取這些資訊:

> BITFIELD user:1:info SET u8 #0 1 SET u8 #1 25 SET u16 #2 165 SET u16 #3 50000
0
0
0
0

然后,獲取這個用戶的資訊,性別、年齡、身高、體重

> BITFIELD user:1:info GET u8 #0 GET u8 #1 GET u16 #2 GET u16 #3
1
25
165
50000

轉載請註明出處,本文鏈接:https://www.uj5u.com/net/552063.html

標籤:.NET Core

上一篇:C#自定義例外就這么簡單

下一篇:返回列表

標籤雲
其他(158753) Python(38124) JavaScript(25412) Java(18024) C(15224) 區塊鏈(8263) C#(7972) AI(7469) 爪哇(7425) MySQL(7175) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5336) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4570) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2432) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1965) Web開發(1951) HtmlCss(1934) python-3.x(1918) 弹簧靴(1913) C++(1912) xml(1889) PostgreSQL(1875) .NETCore(1858) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • WebAPI簡介

    Web體系結構: 有三個核心:資源(resource),URL(統一資源識別符號)和表示 他們的關系是這樣的:一個資源由一個URL進行標識,HTTP客戶端使用URL定位資源,表示是從資源回傳資料,媒體型別是資源回傳的資料格式。 接下來我們說下HTTP. HTTP協議的系統是一種無狀態的方式,使用請求/ ......

    uj5u.com 2020-09-09 22:07:47 more
  • asp.net core 3.1 入口:Program.cs中的Main函式

    本文分析Program.cs 中Main()函式中代碼的運行順序分析asp.net core程式的啟動,重點不是剖析原始碼,而是理清程式開始時執行的順序。到呼叫了哪些實體,哪些法方。asp.net core 3.1 的程式入口在專案Program.cs檔案里,如下。ususing System; us ......

    uj5u.com 2020-09-09 22:07:49 more
  • asp.net網站作為websocket服務端的應用該如何寫

    最近被websocket的一個問題困擾了很久,有一個需求是在web網站中搭建websocket服務。客戶端通過網頁與服務器建立連接,然后服務器根據ip給客戶端網頁發送資訊。 其實,這個需求并不難,只是剛開始對websocket的內容不太了解。上網搜索了一下,有通過asp.net core 實作的、有 ......

    uj5u.com 2020-09-09 22:08:02 more
  • ASP.NET 開源匯入匯出庫Magicodes.IE Docker中使用

    Magicodes.IE在Docker中使用 更新歷史 2019.02.13 【Nuget】版本更新到2.0.2 【匯入】修復單列匯入的Bug,單元測驗“OneColumnImporter_Test”。問題見(https://github.com/dotnetcore/Magicodes.IE/is ......

    uj5u.com 2020-09-09 22:08:05 more
  • 在webform中使用ajax

    如果你用過Asp.net webform, 說明你也算是.NET 開發的老兵了。WEBform應該是2011 2013左右,當時還用visual studio 2005、 visual studio 2008。后來基本都用的是MVC。 如果是新開發的專案,估計沒人會用webform技術。但是有些舊版 ......

    uj5u.com 2020-09-09 22:08:50 more
  • iis添加asp.net網站,訪問提示:由于擴展配置問題而無法提供您請求的

    今天在iis服務器配置asp.net網站,遇到一個問題,記錄一下: 問題:由于擴展配置問題而無法提供您請求的頁面。如果該頁面是腳本,請添加處理程式。如果應下載檔案,請添加 MIME 映射。 WindowServer2012服務器,添加角色安裝完.netframework和iis之后,運行aspx頁面 ......

    uj5u.com 2020-09-09 22:10:00 more
  • WebAPI-處理架構

    帶著問題去思考,大家好! 問題1:HTTP請求和回傳相應的HTTP回應資訊之間發生了什么? 1:首先是最底層,托管層,位于WebAPI和底層HTTP堆疊之間 2:其次是 訊息處理程式管道層,這里比如日志和快取。OWIN的參考是將訊息處理程式管道的一些功能下移到堆疊下端的OWIN中間件了。 3:控制器處理 ......

    uj5u.com 2020-09-09 22:11:13 more
  • 微信門戶開發框架-使用指導說明書

    微信門戶應用管理系統,采用基于 MVC + Bootstrap + Ajax + Enterprise Library的技術路線,界面層采用Boostrap + Metronic組合的前端框架,資料訪問層支持Oracle、SQLServer、MySQL、PostgreSQL等資料庫。框架以MVC5,... ......

    uj5u.com 2020-09-09 22:15:18 more
  • WebAPI-HTTP編程模型

    帶著問題去思考,大家好!它是什么?它包含什么?它能干什么? 訊息 HTTP編程模型的核心就是訊息抽象,表示為:HttPRequestMessage,HttpResponseMessage.用于客戶端和服務端之間交換請求和回應訊息。 HttpMethod類包含了一組靜態屬性: private stat ......

    uj5u.com 2020-09-09 22:15:23 more
  • 部署WebApi隨筆

    一、跨域 NuGet參考Microsoft.AspNet.WebApi.Cors WebApiConfig.cs中配置: // Web API 配置和服務 config.EnableCors(new EnableCorsAttribute("*", "*", "*")); 二、清除默認回傳XML格式 ......

    uj5u.com 2020-09-09 22:15:48 more
最新发布
  • 聊一聊redis十種資料型別及底層原理

    概述 Redis 是一個開源的高性能鍵值資料庫,它支持多種資料型別,可以滿足不同的業務需求。本文將介紹 Redis 的10種資料型別,分別是 string(字串) hash(哈希) list(串列) set(集合) zset(有序集合) stream(流) geospatial(地理) bitma ......

    uj5u.com 2023-05-10 10:03:30 more
  • C#自定義例外就這么簡單

    C#是一種強型別語言,可以捕獲和處理各種例外,從而幫助我們發現程式中出現的錯誤。在程式開發程序中,如果需要找到特定的錯誤情況并處理,這時就需要創建自定義例外。本文將介紹如何在C#中創建和使用自定義例外。 1、什么是例外? 例外是指在程式執行期間發生的錯誤或例外情況,例如除法中除以0、檔案不存在、記憶體 ......

    uj5u.com 2023-05-10 10:02:27 more
  • 聊一聊 dotnet-trace 調查 lock鎖競爭

    一:背景 1. 講故事 最近在分析一個 linux 上的 dump,最后的誘因是大量的lock鎖誘發的高頻背景關系切換,雖然問題告一段落,但我還想知道一點資訊,所謂的高頻到底有多高頻?鎖競爭到底是一個怎樣的鎖競爭? 如果了解這些資訊對我們后續分析此類問題非常有幫助。 要想獲取此類資訊,看 dump 肯 ......

    uj5u.com 2023-05-10 10:02:13 more
  • AutoCAD二次開發系列教程01-如何在AutoCAD中輸出Hello World

    <a href="https://www.cnblogs.com/looufly/" target="_blank"><img width="48" height="48" class="pfs" src="https://pic.cnblogs.com/face/2601814/20220308105209.png" alt="" /><...

    uj5u.com 2023-05-05 09:47:35 more
  • AutoCAD二次開發系列教程01-如何在AutoCAD中輸出Hello World

    目錄 01專案環境準備 02代碼示例 03輸出示例 04總結 05原始碼地址 01專案環境準備 A.開發使用的軟體:AutoCAD2016、VisualStudio2022 B.建立依賴的本地庫(提前從AutoCAD軟體安裝目錄拷貝開發時需要使用的庫,如:accoremgd.dll) C.創建新的類別庫 ......

    uj5u.com 2023-05-05 09:46:50 more
  • C# 手寫識別方案整理

    <a href="https://www.cnblogs.com/kybs0/" target="_blank"><img width="48" height="48" class="pfs" src="https://pic.cnblogs.com/face/685541/20180427215112.png" alt="" /></a...

    uj5u.com 2023-04-28 12:36:25 more
  • 為HttpClient開啟HTTP/2

    <a href="https://www.cnblogs.com/chenyishi/" target="_blank"><img width="48" height="48" class="pfs" src="https://pic.cnblogs.com/face/1033233/20191022150649.png" alt="" />&...

    uj5u.com 2023-04-28 12:36:12 more
  • .NET Core部署到linux(CentOS)最全解決方案,常規篇

    <a href="https://www.cnblogs.com/88223100/" target="_blank"><img width="48" height="48" class="pfs" src="https://pic.cnblogs.com/face/u27422.jpg" alt="" /></a>...

    uj5u.com 2023-04-28 12:35:26 more
  • 為HttpClient開啟HTTP/2

    <a href="https://www.cnblogs.com/chenyishi/" target="_blank"><img width="48" height="48" class="pfs" src="https://pic.cnblogs.com/face/1033233/20191022150649.png" alt="" />&...

    uj5u.com 2023-04-28 12:34:10 more
  • .NET Core部署到linux(CentOS)最全解決方案,常規篇

    <a href="https://www.cnblogs.com/88223100/" target="_blank"><img width="48" height="48" class="pfs" src="https://pic.cnblogs.com/face/u27422.jpg" alt="" /></a>...

    uj5u.com 2023-04-28 12:28:18 more