主頁 > 資料庫 > 架構師日記-從資料庫發展歷程到資料結構設計探析

架構師日記-從資料庫發展歷程到資料結構設計探析

2023-05-16 15:29:42 資料庫

作者:京東零售 煉訓卿

一 資料庫發展史

起初,資料的管理方式是檔案系統,資料存盤在檔案中,資料管理和維護都由程式員完成,后來發展出樹形結構和網狀結構的資料庫,但都存在著難以擴展和維護的問題,直到七十年代,關系資料庫理論的提出,以表格形式組織資料,資料之間存在關聯關系,具有了良好的結構化和規范化特性,成為主流資料庫型別,

先來看一張資料庫發展史圖鑒:

隨之高并發大資料時代的來臨,資料庫按照各種應用場景進行了更細粒度的拆分和演進,資料庫細分領域的典型代表:

型別 產品代表 適用場景
層次資料庫(NDB) IMS/IDMS 以樹形結構組織資料,資料之間存在父子關系,查詢速度快,但難以擴展和維護
關系型資料庫(RDBMS) Oracle/MySQL 事務的一致性需求場景
鍵值資料庫(KVDB) Redis/Memcached 針對高性能并發讀寫場景
檔案資料庫(DDB) MongoDB/CouchDB 針對海量復雜資料訪問場景
圖資料庫(GDB) Neo4j 以點、邊為基礎存盤單元,高效存盤、查詢圖資料場景
時序資料庫(TSDB) InfluxDB/OpenTSDB 針對時序資料的持久化和多維度的聚合查詢等場景
物件資料庫(ODB) Db4O 支持完整的面向物件(OO)概念和控制機制,目前使用場景較少
搜索引擎(SE) ElasticSearch/Solr 適合于以搜索為主的業務場景
列資料庫(WCDB) HBase/ClickHouse 分布式存盤的海量資料存盤和查詢場景
XML資料庫(NXD) MarkLogic 支持對XML格式檔案進行存盤和查詢等操作場景
內容倉庫(CDB) Jackrabbit 大規模高性能的內容倉庫

二 資料庫名詞概念

RDBS

1970年的6月,IBM 公司的研究員埃德加·考特 (Edgar Frank Codd) 發表了那篇著名的《大型共享資料庫資料的關系模型》(A Relational Model of Data for Large Shared Data Banks)的論文,拉開了關系型資料庫(Relational DataBase Server)軟體革命的序幕(之前是層次模型和網狀模型資料庫為主),直到現在,關系型資料庫在基礎軟體應用領域仍是最主要的資料存盤方式之一,

關系型資料庫建立在關系型資料模型的基礎上,是借助于集合代數等數學概念和方法來處理資料的資料庫,在關系型資料庫中,物體以及物體間的聯系均由單一的結構型別來表示,這種邏輯結構是一張二維表,關系型資料庫以行和列的形式存盤資料,這一系列的行和列被稱為表,一組表組成了資料庫,

NoSQL

NoSQL(Not Only SQL) 資料庫也即非關系型資料庫,它是在大資料的時代背景下產生的,它可以處理分布式、規模龐大、型別不確定、完整性沒有保證的“雜亂”資料,這是傳統的關系型資料庫遠遠不能勝任的,NoSQL資料庫并沒有一個統一的模型,是以犧牲事務機制和強一致性機制,來獲取更好的分布式部署和橫向擴展能力,使其在不同的應用場景下,對特定業務資料具有更強的處理性能,常用資料模型示例如下:

型別 產品代表 應用場景 資料模型 優缺點
鍵值資料庫 Redis/Memcached 內容快取,如會話,組態檔等; 頻繁讀寫,擁有簡單資料模型的應用; 鍵值對,通過散串列來實作 優點: 擴展性和靈活性好,性能高; 缺點: 資料無結構化,只能通過鍵來查詢
列簇資料庫 HBase/ClickHouse 分布式資料存盤管理 以列簇存盤,將同一列存在一起 優點: 簡單,擴展性強,查詢速度快 缺點: 功能局限,不支持事務的強一致性
檔案資料庫 MongoDB/CouchDB Web應用,存盤面向檔案或半結構化資料 鍵值對,value是JSON結構檔案 優點: 資料結構靈活 缺點: 缺乏統一查詢語法
圖形資料庫 Neo4j/InfoGrid 社交網路,應用監控,推薦系統等專注構建關系圖譜 圖結構 優點: 支持復雜的圖形演算法 缺點: 復雜性高,支持資料規模有限

NewSQL

NewSQL 是一類新的關系型資料庫, 是各種新的可擴展和高性能的資料庫的簡稱,它不僅具有 NoSQL 資料庫對海量資料的存盤管理能力,同時還保留了傳統資料庫支持的 ACID 和 SQL 特性,典型代表有TiDB和OceanBase,

OLTP

聯機事務處理程序(On-Line Transaction Processing):也稱為面向交易的處理程序,其基本特征是前臺接收的用戶資料可以立即傳送到計算中心進行處理,并在很短的時間內給出處理結果,是對用戶操作快速回應的方式之一,

OLAP

聯機分析處理(On-Line Analytical Processing)是一種面向資料分析的處理程序,它使分析人員能夠迅速、一致、互動地從各個方面觀察資訊,以達到深入理解資料的目的,它具有FASMI(Fast Analysis of Shared Multidimensional Information),即共享多維資訊的快速分析的特征,

關于OLTP和OLAP的區別,借用一張表格對比如下:

HTAP

HTAP (Hybrid Transactional/Analytical Processing) 混合型資料庫基于新的計算存盤框架,能夠同時支撐OLTP和OLAP場景,避免傳統架構中大量資料互動造成的資源浪費和沖突,

三 領域資料庫

列式資料庫

傳統的以行形式保存的資料主要滿足OLTP應用,列形式保存的資料主要滿足以查詢為主的OLAP應用,在列式資料庫中,資料按列存盤,而每個列中的資料型別相同,這種存盤方式使列式資料庫能夠更高效地處理大量的資料,特別是需要進行大規模的資料分析和處理時(如金融、醫療、電信、能源、物流等行業),

兩種存盤結構的區別如下圖:

列式資料庫的主要優點:

?更高的壓縮比率:由于每個列中的資料型別相同,列式資料庫可以使用更高效的壓縮演算法來壓縮資料(壓縮比可達到5~20倍),從而減少存盤空間的使用,

?更快的查詢速度:列式資料庫可以只讀取需要的列,而不需要讀取整行資料,從而加快查詢速度,

?更好的擴展性:列式資料庫可以更容易地進行水平擴展,即增加更多的節點和服務器來處理更大規模的資料,

?更好的資料分析支持:由于列式資料庫可以處理大規模的資料,它可以支持更復雜的資料分析和處理操作,例如資料挖掘、機器學習等,

列式資料庫的主要缺點:

?更慢的寫入速度:由于資料是按列存盤,每次寫入都需要寫入整個列,而不是單個行,因此寫入速度可能較慢,

?更復雜的資料模型:由于資料是按列存盤,資料模型可能比行式資料庫更復雜,需要更多的設計和開發作業,

列式資料庫的應用場景:

?金融:金融行業的交易資料和市場資料,例如股票價格、外匯匯率、利率等,列式資料庫可以更快速地處理這些資料,并且支持更復雜的資料分析和處理操作,例如風險管理、投資分析等,

?醫療:醫療行業的病歷資料、醫療影像和實驗資料等,列式資料庫可以更高效地存盤和處理這些資料,并且支持更復雜的醫學研究和分析操作,

?電信:電信行業的用戶資料和通信資料,例如電話記錄、短信記錄、網路流量等,列式資料庫可以更快速地處理這些資料,并且支持更復雜的用戶行為分析和網路優化操作,

?能源:能源行業的傳感器資料、監測資料和生產資料等,列式資料庫可以更高效地存盤和處理這些資料,并且支持更復雜的能源管理和控制操作,

?物流:物流行業的運輸資料、庫存資料和訂單資料等,列式資料庫可以更快速地處理這些資料,并且支持更復雜的物流管理和優化操作,

總之,列式資料庫是一種高效處理大規模資料的資料庫管理系統,但需要權衡寫入速度、資料模型復雜度和成本等因素, 隨著傳統關系型資料庫與新興的分布式資料庫不斷的發展,列式存盤與行式存盤會不斷融合,資料庫系統呈現雙模式資料存放方式,

時序數據庫

時序資料庫全稱為時間序列資料庫 ( Time Series Database),用于存盤和管理時間序列資料的專業化資料庫,是優化用于攝取、處理和存盤時間戳資料的資料庫,其跟常規的關系資料庫SQL相比,最大的區別在于:時序資料庫是以時間為索引的規律性時間間隔記錄的資料庫,

時序資料庫在物聯網和互聯網應用程式監控(APM)等場景應用比較多,以監控資料采集來舉例,如果資料監控資料采集時間間隔是1s,那一個監控項每天會產生86400個資料點,若有10000個監控項,則一天就會產生864000000個資料點,在物聯網場景下,這個數字會更大,整個資料的規模,是TB甚至是PB級的,

時序資料庫發展史:

當下最常見的Kubernetes容器管理系統中,通常會搭配普羅米修斯(Prometheus)進行監控,Prometheus就是一套開源的監控&報警&時間序列資料庫的組合,

圖資料庫

圖資料庫(Graph Database)是基于圖論實作的一種新型NoSQL資料庫,它的資料存盤結構和資料的查詢方式都是以圖論為基礎的,圖論中圖的基本元素為節點和邊,在圖資料庫中對應的就是節點和關系,

圖資料庫在反欺詐多維關聯分析場景,社交網路圖譜,企業關系圖譜等場景中可以做一些非常復雜的關系查詢,這是由于圖資料結構表現的是物體聯系本身,它表現了現實世界中事物聯系的本質,它的聯系在節點創建時就已經建立,所以在查詢中能以快捷的路徑回傳關聯資料,從而表現出非常高效的查詢性能,

目前市面上較為流行的圖資料庫產品有以下幾種:

與傳統的關系資料庫相比,圖資料庫具有以下優點:

1.更快的查詢速度:圖資料庫可以快速遍歷圖資料,找到節點之間的關聯和路徑,因此查詢速度更快,

2.更好的擴展性:圖資料庫可以輕松地擴展到大規模的資料集,因為它們可以分布式存盤和處理資料,

3.更好的資料可視化:圖資料庫可以將資料可視化為圖形,使用戶更容易理解和分析資料,

4.更好的資料一致性:圖資料庫可以確保資料的一致性,因為它們可以在節點和邊之間建立強制性的關系,

四 資料結構設計

前面簡單介紹了資料庫相關的基礎知識,下面再介紹幾種我們常見的資料結構設計相關的應用實踐:拉鏈表,位運算和環形佇列,

4.1 拉鏈表

拉鏈表是一種資料倉庫中常用的資料模型,用于記錄維度資料的變化歷史,我們以一個人員變動的場景舉例,假設有一個員工資訊表,其中包含了員工的姓名、工號、職位、部門、入職時間等資訊,如果需要記錄員工的變動情況,就可以使用拉鏈表來實作,

首先,在員工資訊表的基礎上新增兩個欄位:生效時間和失效時間,當員工資訊發生變動時,不再新增一條記錄,而是修改原有記錄的失效時間,同時新增一條新的記錄,如下表所示:

姓名 工號 職位 部門 入職時間 生效時間 失效時間
張三 001 經理 技術 2010-01-01 2010-01-01 2012-12-31
張三 001 總監 技術 2013-01-01 2013-01-01 2015-12-31
張三 001 總經理 技術 2016-01-01 2016-01-01 9999-12-31

這里的生效時間指的是該記錄生效的時間,失效時間指的是該記錄失效的時間,例如,張三最初是技術部經理,生效時間為入職時間,失效時間為2012年底,之后晉升為技術部總監,生效時間為2013年初,失效時間為2015年底,最后又晉升為技術部總經理,生效時間為2016年初,失效時間為9999年底,

通過這種方式,可以記錄員工變動的歷史資訊,并能夠方便地查詢某個時間點的員工資訊,例如,如果需要查詢張三在2014年的職位和部門資訊,只需查詢生效時間小于2014年且失效時間大于2014年的記錄即可,

拉鏈表通常包括以下幾個欄位:

1.主鍵:唯一標識每個記錄的欄位,通常是一個或多個列的組合,
2.生效時間:記錄的生效時間,即該記錄開始生效的時間,
3.失效時間:記錄的失效時間,即該記錄失效的時間,
4.版本號:記錄的版本號,用于標識該記錄的版本,
5.其他維度屬性:記錄的其他維度屬性,如客戶名、產品名、員工名等,

當一個記錄的維度屬性發生變化時,不再新增一條記錄,而是修改原有記錄的失效時間,同時新增一條新的記錄,新記錄的生效時間為變化的時間,失效時間為9999年底,這樣就能夠記錄每個維度屬性的歷史變化資訊,同時保證查詢時能夠正確獲取某個時間點的維度屬性資訊,

拉鏈表與傳統的流水表相比,它們的主要區別在于:

1.資料結構不同:流水表是一張只有新增和更新操作的表,每次更新都會新增一條記錄,記錄中包含了所有的歷史資訊,而拉鏈表則是一張有新增、更新和洗掉操作的表,每個記錄都有一個生效時間段和失效時間段,記錄的歷史資訊通過時間段的變化來體現,

2.查詢方式不同:流水表的查詢方式是基于時間點的查詢,即查詢某個時間點的記錄資訊,而拉鏈表的查詢方式是基于時間段的查詢,即查詢某個時間段內的記錄資訊,

3.存盤空間不同:由于流水表需要記錄所有歷史資訊,所以存盤空間相對較大,而拉鏈表只記錄生效時間段和失效時間段,所以存盤空間相對較小,

4.資料更新方式不同:流水表只有新增和更新操作,每次更新都會新增一條記錄,不會對原有記錄進行修改,而拉鏈表有新增、更新和洗掉操作,每次更新會修改原有記錄的失效時間,同時新增一條新的記錄,

4.2 巧用位運算

借助于計算機位運算的特性,可以巧妙的解決某些特定問題,使實作更加優雅,節省存盤空間的同時,也可以提高運行效率,典型應用場景:壓縮存盤、位圖索引、資料加密、圖形處理和狀態判斷等,下面介紹幾個典型案例,

4.2.1 位運算

?使用位運算實作開關和多選項疊加(資源權限)等應用場景,一個int型別有32個位,理論上可以表示32個開關狀態或業務選項;以用戶每個月的簽到場景舉例:用一個int欄位來表示用戶一個月的簽到情況,0表示未簽到,1表示簽到,想知道某一天是否簽到,則只需要判斷對應的位元位上是否為1,計算一個月累計簽到了多少次,只需要統計有多少個位元位為1就可以了,這種設計巧妙的資料存盤結構在后面的位圖(BitMap)中,還會進行更為詳細的介紹,

?使用位運算實作業務優先級計算:

public abstract class PriorityManager {
    // 定義業務優先級常量
    public static final int PRIORITY_LOW = 1;     // 二進制:001
    public static final int PRIORITY_NORMAL = 2;  // 二進制:010
    public static final int PRIORITY_HIGH = 4;    // 二進制:100
    
    // 定義用戶權限常量
    public static final int PERMISSION_READ = 1;  // 二進制:001
    public static final int PERMISSION_WRITE = 2; // 二進制:010
    public static final int PERMISSION_DELETE = 4;// 二進制:100
    
    // 定義用戶權限和業務優先級的組合值
    public static final int PERMISSION_LOW_PRIORITY = PRIORITY_LOW | PERMISSION_READ;     // 二進制:001 | 001 = 001
    public static final int PERMISSION_NORMAL_PRIORITY = PRIORITY_NORMAL | PERMISSION_READ | PERMISSION_WRITE;  // 二進制:010 | 001 | 010 = 011
    public static final int PERMISSION_HIGH_PRIORITY = PRIORITY_HIGH | PERMISSION_READ | PERMISSION_WRITE | PERMISSION_DELETE;  // 二進制:100 | 001 | 010 | 100 = 111
    
    // 判斷用戶權限是否滿足業務優先級要求
    public static boolean checkPermission(int permission, int priority) {
        return (permission & priority) == priority;
    }
}

?其它使用位運算的典型場景:HashMap中的佇列長度的設計和執行緒池ThreadPoolExcutor中使用AtomicInteger欄位ctl,存盤當前執行緒池狀態和執行緒數量(高3位表示當前執行緒的狀態,低29位表示執行緒的數量),

4.2.2 BitMap

位圖(BitMap)是一種常用的資料結構,在索引,資料壓縮等方面有廣泛應用,基本思想就是用一個bit位來標記某個元素對應的Value,而Key即是該元素,由于采用了Bit為單位來存盤資料,因此可以大大節省存盤空間,是少有的既能保證存盤空間又能保證查找速度的資料結構(而不必空間換時間),

舉個例子,假設有這樣一個需求:在20億個隨機整數中找出某個數m是否存在其中,并假設32位作業系統,4G記憶體,在Java中,int占4位元組,1位元組=8位(1 byte = 8 bit),

?如果每個數字用int存盤,那就是20億個int,因而占用的空間約為 (2000000000*4/1024/1024/1024)≈7.45G

?如果按位存盤就不一樣了,20億個數就是20億位,占用空間約為 (2000000000/8/1024/1024/1024)≈0.233G

存盤空間可以壓縮節省31倍!那么它是如何通過二進制位實作數字標記的呢? 其原理是用每個二進制位(下標)表示一個真實數字,0表示不存在,1表示存在,這樣我們可以很容易表示{1,2,4,6}這幾個數:

計算機記憶體分配的最小單位是位元組,也就是8位,那如果要表示{12,13,15}怎么辦呢?可以另申請一個位元組b[1]:

通過一個二維陣列來實作位數疊加,1個int占32位,那么我們只需要申請一個int陣列長度為 int index[1+N/32] 即可存盤,其中N表示要存盤的這些數中的最大值:

index[0]:可以表示0~31

index[1]:可以表示32~63

index[2]:可以表示64~95

以此類推...如此一來,給定任意整數M,那么M/32就得到下標,M%32就知道它在此下標的哪個位置,

BitMap資料結構通常用于以下場景:

1.壓縮存盤大量布林值:BitMap可以有效地壓縮大量的布林值,從而減少記憶體的使用;

2.快速判斷一個元素是否存在:BitMap可以快速地判斷一個元素是否存在,只需要查找對應的位即可;

3.去重:BitMap可以用于去重操作,將元素作為索引,將對應的位設定為1,重復元素只會對應同一個位,從而實作去重;

4.排序:BitMap可以用于排序,將元素作為索引,將對應的位設定為1,然后按照索引順序遍歷位陣列,即可得到有序的元素序列;

5.ElasticSearch和Solr等搜索引擎中,在設計搜索剪枝時,需要保存已經搜索過的歷史資訊,可以使用位圖減小歷史資訊資料所占空間;

4.2.3 布隆過濾器

位圖(Bitmap)這種資料存盤結構,如果資料量大到一定程度,比如64bit型別的資料,簡單算一下存盤空間就知道,海量硬體資源要求,已經不太現實了:

所以另一個著名的工業實作——布隆過濾器(Bloom Filter) 出現了,如果說BitMap對于每一個可能的整型值,通過直接尋址的方式進行映射,相當于使用了一個哈希函式,那布隆過濾器就是引入了k ( k > 1 )個相互獨立的哈希函式,保證在給定的空間和誤判率情況下,完成元素判重的程序,下圖中是k = 3 時的布隆過濾器:

布隆過濾器的內部依賴于哈希演算法,當檢測某一條資料是否見過時,有一定概率出現假陽性(False Positive),但一定不會出現假陰性(False Negative),也就是說,當 布隆過濾器認為一條資料出現過,那么該條資料很可能出現過;但如果布隆過濾器認為一條資料沒出現過,那么該條資料一定沒出現過,布隆過濾器通過引入一定錯誤率,使得海量資料判重在可以接受的記憶體代價中得以實作,

上圖中,x,y,z經由哈希函式映射將各自在Bitmap中的3個位置置為1,當w出現時,僅當3個標志位都為1時,才表示w在集合中,圖中所示的情況,布隆過濾器將判定w不在集合中,

常見實作

?Java中Guava工具包中實作;

?Redis 4.0開始以插件形式提供布隆過濾器功能;

適用場景

?網頁爬蟲對URL的去重,避免爬去相同的URL地址,比如Chrome瀏覽器就是使用了一個布隆過濾器識別惡意鏈接;

?垃圾郵件過濾,從數十億個垃圾郵件串列中判斷某郵箱是否是殺垃圾郵箱;

?解決資料庫快取擊穿,黑客攻擊服務器時,會構建大量不存在于快取中的key向服務器發起請求,在資料量足夠大的時候,頻繁的資料庫查詢會導致掛機;

?谷歌Bigtable、Apache HBase、Apache Cassandra和PostgreSQL使用布隆過濾器來減少對不存在的行或列的磁盤查找;

?秒殺系統,查看用戶是否重復購買;

4.3 環形佇列

環形佇列是一種用于表示一個固定尺寸、頭尾相連的資料結構,很適合快取資料流,在通信開發(Socket,TCP/IP,RPC開發),在內核的行程間通信(IPC),視頻音頻播放等各種場景中,都有其身影,日常開發程序中使用的Dubbo、Netty、Akka、Quartz、ZooKeeper 、Kafka等各種中間件,也都有環形佇列的思想,下面介紹兩種常用的環形資料結構:Hash環和時間輪,

4.3.1 一致性Hash環

先來看一下,典型Hash演算法結構如下:

以上圖Hash策略為例,當節點數N發生變化的時候 之前所有的 hash映射幾乎全部失效,如果集群是無狀態的服務,倒是沒什么事情,但是如果是分布式快取這種場景,就會導致比較嚴重的問題,比如 Key1原本是路由到Node1上,命中快取的Value1資料,但是當N節點變化后,Key1可能就路由到了Node2節點,這就產生了快取資料無法命中的問題,而無論是機器故障還是快取擴容,都會導致節點數的變化,

如何解決上面場景的問題呢?就是接下來介紹的一致性Hash演算法,

一致性哈希將整個哈希值空間組織成一個虛擬的圓環,假設某哈希函式H的值空間為0-2^32-1(即哈希值是一個32位無符號整型),所有的輸入值都被映射到 0-2^32-1 之間,組成一個圓環,整個哈希空間環如下:

路由資料的程序如下:將資料key使用相同的函式Hash計算出哈希值,并確定此資料在環上的位置,從此位置沿環順時針“行走”,遇到的第一個節點就是其應該定位到的服務器,如果某個節點的服務器故障,其影響范圍也不再是所有集群,而是限定在故障節點與其上游節點的部磁區域,

當某個節點宕機后,原本屬于它的請求都會被重新hash映射到下游節點,會突然造成下游節點壓力過大有可能也會造成下游節點宕機,從而容易形成雪崩,為此引入了虛擬節點來解決這個問題,

根據Node節點生成很多的虛擬節點分布在圓環上,,一個真實節點映射對應多個虛擬節點,這樣當某個節點掛了后原本屬于它的請求,會被均衡的分布到其他節點上降低了產生雪崩的情況,也解決了物理節點數少,導致請求分布不均的問題,

帶有虛擬節點的Hash環:

一致性Hash演算法由于均衡性,持久性的映射特點被廣泛應用于負載均衡領域,比如nginx、dubbo等內部都有一致性hash的實作,

4.3.2 時間輪分片

時間輪(TimeWheel)是一種實作延遲功能(定時器)的精妙的演算法,可以實作高效的延時佇列,以Kafka中的時間輪實作方案為例,它是一個存盤定時任務的環形佇列,底層采用陣列實作,陣列中的每個元素可以存放一個定時任務串列(TimerTaskList),TimerTaskList是一個環形的雙向鏈表,鏈表中的每一項表示的都是定時任務項(TimerTaskEntry),其中封裝了真正的定時任務TimerTask,

通過上圖可以發現,時間輪演算法不再任務佇列作為資料結構,輪詢執行緒不再負責遍歷所有任務,而是僅僅遍歷時間刻度,時間輪演算法好比指標不斷在時鐘上旋轉、遍歷,如果一個發現某一時刻上有任務(任務佇列),那么就會將任務佇列上的所有任務都執行一遍,

假設相鄰bucket到期時間的間隔為bucket=1s,從0s開始計時,1s后到期的定時任務掛在bucket=1下,2s后到期的定時任務掛在bucket=2下,當檢查到時間過去了1s時,bucket=1下所有節點執行超時動作,當時間到了2s時,bucket=2下所有節點執行超時動作,時間輪使用一個表盤指標(pointer),用來表示時間輪當前指標跳動的次數,可以用tickDuration * (pointer + 1)來表示下一次到期的任務,需要處理此bucket所對應的 TimeWheel中的所有任務,

時間輪的優點

1.任務的添加與移除,都是O(1)級的復雜度;

2.只需要有一個執行緒去推進時間輪,不會占用大量的資源;

3.與其他任務調度模式相比,CPU的負載和資源浪費減少;

適用場景

時間輪是為解決高效調度任務而產生的調度模型,在周期性定時任務,延時任務,通知任務等場景都可以發揮效用,

五 總結

本文針對資料存盤相關名詞概念進行了解釋,重點介紹了資料庫技術的發展史,為了豐富文章的可讀性以及實用性,又從資料結構設計層面進行了部分技術實戰能力的外延擴展,闡述了拉鏈表,位運算,環形佇列等相關資料結構在軟體開發領域的應用,希望本文給你帶來識訓,

注:本文個別圖片來自互聯網

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/552586.html

標籤:其他

上一篇:MySQL 存盤程序&觸發器&事務

下一篇:返回列表

標籤雲
其他(159121) Python(38137) JavaScript(25431) Java(18044) C(15226) 區塊鏈(8267) C#(7972) AI(7469) 爪哇(7425) MySQL(7191) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5340) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4572) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2433) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1973) 功能(1967) Web開發(1951) HtmlCss(1937) python-3.x(1918) C++(1917) 弹簧靴(1913) xml(1889) PostgreSQL(1877) .NETCore(1860) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • 架構師日記-從資料庫發展歷程到資料結構設計探析

    本文針對資料存盤相關名詞概念進行了解釋,重點介紹了資料庫技術的發展史。為了豐富文章的可讀性以及實用性,又從資料結構設計層面進行了部分技術實戰能力的外延擴展,闡述了拉鏈表,位運算,環形佇列等相關資料結構在軟體開發領域的應用,希望本文給你帶來識訓。 ......

    uj5u.com 2023-05-16 15:29:42 more
  • MySQL 存盤程序&觸發器&事務

    存盤程序 概念 存盤程序(Stored Procedure),是為了完成特定功能的SQL陳述句集。 優點 存盤程序可以理解為shell腳本這型別的命令集輸出工具,但是在底層,存盤程序擁有更多的優點: ==語言的靈活性跟功能性更強==,在原有基礎之上可以插入控制陳述句、回圈陳述句等讓SQL陳述句的功能更強,能 ......

    uj5u.com 2023-05-16 15:29:30 more
  • pg_enterprise_views偶然發現的PG神仙插件!

    一直從事資料庫相關的作業,對于PG而言最大的問題其實是在運維管理方面,其缺乏有效且直觀成體系的系統表,苦覓良久,今日在PG官網中發現了一款新收錄的免費插件,其提供了數十張系統表,內容涵蓋了從作業系統到資料庫的負載指標、等待事件、會話、客戶端、SQL、SQL執行計劃、超時鎖、長事務、資料庫物件、寫行程 ......

    uj5u.com 2023-05-16 15:28:49 more
  • Redis實戰解讀-初識Redis&Redis基本資料型別

    一.初識Redis
    1.什么是Redis
    ? Redis是一個速度非常快的非關系型資料庫(non-relational database),它可以存盤鍵(key)與五種不同型別的值的映射(mapping),可以將存盤在記憶體的鍵值對資料持久化到磁盤,可以使用復制特性來擴展讀性能,也可以采用客戶端分片來... ......

    uj5u.com 2023-05-16 15:28:18 more
  • Redis資料結構二之SDS和雙向鏈表

    本文首發于公眾號:Hunter后端 原文鏈接:Redis資料結構二之SDS和雙向鏈表 這一篇筆記介紹一下 SDS(simple dynamic string)和雙向鏈表。 以下是本篇筆記目錄: SDS 常數復雜度獲取字串長度 杜絕緩沖區溢位 減少修改字串帶來的記憶體重分配次數 二進制安全 兼容C字 ......

    uj5u.com 2023-05-16 15:28:08 more
  • MySQL 8.0不再擔心被垃圾SQL搞爆記憶體

    MySQL 8.0.28引入的新功能 MySQL 8.0.28開始,新增一個特性,支持監控統計并限制各個連接(會話)的記憶體消耗,避免大量用戶連接因為執行垃圾SQL消耗過多記憶體,造成可能被OOM kill的風險。 首先,需要先設定系統選項 global_connection_memory_tracki ......

    uj5u.com 2023-05-16 15:27:50 more
  • 06~12-Esp8266物聯網芯片的使用(一)-part02/03-ESP8266開發環境、

    上一章主要作了芯片介紹,這一章主要作對開發環境的介紹。 認識Arduino Arduino是一款便捷靈活、方便上手的開源電子原型平臺。包含硬體(各種型號的Arduino板)和軟體(ArduinoIDE)。它構建于開放原始碼simple I/O介面版,并且具有使用類似Java、C語言的Processi ......

    uj5u.com 2023-05-16 15:22:35 more
  • MySQL的varchar存盤原理:InnoDB記錄存盤結構

    摘要:varchar(M) 能存多少個字符,為什么提示最大16383?innodb怎么知道varchar真正有多長?記錄為NULL,innodb如何處理?某個列資料占用的位元組數非常多怎么辦?影響每行實際可用空間的因素有哪些?本篇圍繞innodb默認行格式dynamic來說說原理。 本文分享自華為云社 ......

    uj5u.com 2023-05-16 15:16:31 more
  • 架構師日記-從資料庫發展歷程到資料結構設計探析

    本文針對資料存盤相關名詞概念進行了解釋,重點介紹了資料庫技術的發展史。為了豐富文章的可讀性以及實用性,又從資料結構設計層面進行了部分技術實戰能力的外延擴展,闡述了拉鏈表,位運算,環形佇列等相關資料結構在軟體開發領域的應用,希望本文給你帶來識訓。 ......

    uj5u.com 2023-05-16 15:15:50 more
  • MySQL 存盤程序&觸發器&事務

    存盤程序 概念 存盤程序(Stored Procedure),是為了完成特定功能的SQL陳述句集。 優點 存盤程序可以理解為shell腳本這型別的命令集輸出工具,但是在底層,存盤程序擁有更多的優點: ==語言的靈活性跟功能性更強==,在原有基礎之上可以插入控制陳述句、回圈陳述句等讓SQL陳述句的功能更強,能 ......

    uj5u.com 2023-05-16 15:15:37 more