清醒點
目錄- Java虛擬執行緒
- 簡介
- 執行緒(Thread)簡介
- 并行(parallel)與并發(concurrent)執行
- 為什么要使用多執行緒?
- 多執行緒如何影響系統的效率?
- 對于唯一詞計算效率又該如何呢?
- 增加執行緒是否可以解決這個問題呢?
- 執行緒內部是怎樣作業的?
- Java內部執行緒實作模式
- 當前Java執行緒模型有什么問題嗎?
- 現實世界的例子
- 虛擬執行緒(Virtual Thread)
- 虛擬執行緒如何作業
- Java虛擬執行緒實體
- 綠色執行緒 VS 虛擬執行緒
- 總結
- 參考
Java虛擬執行緒
flowchart LR introduction-->a(why thread)-->b(parallel and concurrent execution)-->c(why threads?)-->d(how does thread work)-->e(java thread model)-->f(virtual thread)-->g(why virtual thread)-->h(comparasion) a-->c d-->f翻譯自 screencapture-pradeesh-kumar-medium-an-era-of-virtual-threads-java
簡介
“虛擬執行緒”的概念越來越火,很多編程語言都嘗試將其加入到執行緒庫中,Java也不例外,JDK19中便加入了虛擬執行緒(預覽版)JEP425,本文主要深入淺出介紹執行緒的前世今身,以及虛擬執行緒帶來的全新體驗和優勢,最后會對幾種不同的執行緒實作方式進行對比
執行緒(Thread)簡介
一個電腦程式,本質上就是實作特定任務任務的一系列指令,當你加載一個程式時,作業系統加載程式檔案,并將其放置在一個指定區域(地址空間),然后執行它所包含的指令,這時候,它就被作為了一個“行程”,換句話說,一個行程就是一個程式運行在電腦中的實體,
一個執行緒就是行程里的一系列可以獨立運行的指令,通常執行緒在CPU的一個核上運行,一個行程可以擁有多個執行緒,允許多個執行緒同時執行即同時執行多個任務,這樣可以更好的利用CPU資源,提高任務吞吐量,例如,當你加載谷歌瀏覽器,系統便創建了一個谷歌瀏覽器的行程,你可以同事做很多事情,比如說同時下載檔案和瀏覽網頁,因為這些功能運行在不同的執行緒之上,執行緒也可以叫做輕量級行程,因為執行緒之間共享了行程的地址空間,
flowchart LR disk--load-->memory--assign-->process process--include-->thread1 process--include-->thread2 process--include-->thread3 process--include-->thread4并行(parallel)與并發(concurrent)執行
并行執行:同時執行多個任務,例如,一臺四核的機器,可以每個核執行一個任務,所有的任務是同時執行的,
并發執行::電腦制造了一種同時執行任務數比CPU核數更多的錯覺,例如,一個四核的電腦,可以執行8個不同的任務,因為你只有四核,所以必須做背景關系切換來執行8個任務,在這里作業系統制造了一種并行執行8個任務的錯覺,然而,實際上只有四個任務可以并行執行,因為只有四核,
并行執行圖例:
flowchart LR core1-->thread1 core2-->thread2 core3-->thread3 core4-->thread4并發執行圖例:
flowchart LR core1-->a1(thread1)-->a2(thread4)-->a3(thread1)-->a4(thread8)-->a5(thread4) core2-->b1(thread2)-->b2(thread7)-->b3(thread2)-->b4(thread7)-->b5(thread2) core3-->c1(thread3)-->c2(thread5)-->c3(thread10)-->c4(thread3)-->c5(thread5) core4-->d1(thread5)-->d2(thread9)-->d3(thread5)-->d4(thread11)-->d5(thread1)為什么要使用多執行緒?
首先,讓我們研究一下執行緒是怎樣提高我們的系統效率的,
假如你現在有一臺四核的電腦,你要寫一個兩數之和的程式,同時要求必須執行在12個執行緒中,
代碼如下:
public class SumOfNums {
static void sum() {
int a = 1;
int b = 2;
int sum = a + b;
System.out.println(sum);
}
public static void main(String[] args) {
for (int i = 0; i < 12; i++) {
Thread t = new Thread(SumOfNums::sum);
t.start();
}
}
}
那么有多少執行緒可以并行執行呢?是否12個執行緒都可以并行執行?我們創建了12個執行緒,是否意味著12個執行緒是同時開始執行的?答案是否定的,我們的CPU只有四核,意味著我們并行執行的執行緒數上線就是四核,每個執行緒都必須分配到一個指定的核去執行,通過背景關系切換來完成12個執行緒的并發執行,
那么為什么一個應用會有數百個執行緒?有什么用處?為什么我們不創建恰好等于CPU核數的執行緒?讓我們更深入的研究一下,
任務通常有兩種型別:CPU密集型以及IO密集型,
CPU密集型:任務執行高度依賴CPU,例如算術,邏輯,關聯關系等,這些任務都是CPU密集型;
IO密集型:任務執行高度依賴輸入/輸出操作,例如網路互動,讀取/存盤檔案,這些任務都是IO密集型;
那么我們上面提到的sum
任務屬于哪一種呢?我們創建并初始化了兩個變數a
和b
,將他們求和并輸出到命令列,從始至終都沒有任何的IO操作,數值計算是一個CPU操作,將結果寫到兩一個檔案就是一個IO操作了,
通常來說,一個任務會混合CPU和IO操作,例如讀取一個文本檔案,并計算出其中所有的不同的單詞,然后將結果寫入到另一個文本檔案,在這種情況下,讀取和寫入檔案是一個IO操作,計算不同的單詞是一個CPU操作,
多執行緒如何影響系統的效率?
再思考一下上面的CPU密集型求和代碼,我們使用了12個執行緒并發執行這段代碼,CPU內部切換前后臺執行緒,這樣就可以用4個核心完成12個執行緒的任務,如果還沒有完成一個任務的時候,CPU會切換到另一個執行緒,
12個執行緒真的會提升效率嗎?并非如此,當前的情況下,這里浪費了很多時間在切換背景關系上,對于CPU密集型任務,最好使用和核心數統統的并發執行緒數,以達到最高的效率,
對于唯一詞計算效率又該如何呢?
考慮這樣一種情況,需要讀取20個文本檔案,CPU在讀取檔案時處于空閑狀態,因為檔案讀取發生在硬碟驅動器上,所以只有當檔案背景關系都獲取到了之后,CPU才會開始計算然后將結果寫入到另一個檔案,再寫入程序中,CPU始終處于空閑狀態,等待硬碟驅動器,
也就是說,我們執行的是如下圖所示的單執行緒操作,
flowchart LR a(CPU)--wait-->b(__________IO__________)--hook-->c(CPU calculation)--wait-->d(____________IO__________)--hook-->e(CPU)如上圖所示,CPU在IO進行的時候都是空閑的,這導致了CPU的核心始終跑不滿100%占用率,
現在,我們考慮一下當我們在4核心CPU上跑4個執行緒,如下圖所示:
flowchart LR a1(CPU)--wait-->b1(__________IO__________)--hook-->c1(CPU calculation)--wait-->d1(____________IO__________)--hook-->e1(CPU) a2(CPU)--wait-->b2(__________IO__________)--hook-->c(CPU calculation)--wait-->d2(____________IO__________)--hook-->e2(CPU) a3(CPU)--wait-->b3(__________IO__________)--hook-->c3(CPU calculation)--wait-->d3(____________IO__________)--hook-->e3(CPU) a4(CPU)--wait-->b4(__________IO__________)--hook-->c4(CPU calculation)--wait-->d4(____________IO__________)--hook-->e4(CPU)每一個執行緒被賦予了一個指定的核以并發執行,結果就導致了四核出現了與上面單核一樣占用率不滿的問題,IO期間核心依然是空閑的,
增加執行緒是否可以解決這個問題呢?
然我們來看一下如果我們使用八個執行緒會怎樣:
flowchart LR core1-->a1(thread1)-->a2(thread2__)-->a3(_____thread1______)-->a4(__thread2__)-->a5(thread1) core2-->b1(thread3)-->b2(____thread4____)-->b3(thread3)-->b4(thread4)-->b5(thread2) core3-->c1(thread6)-->c2(thread5)-->c3(thread10)-->c4(thread3)-->c5(thread5) core4-->d1(thread5)-->d2(thread6)-->d3(thread5)-->d4(thread8)-->d5(thread1)首先來看第一個核core1
,當thread1
進行IO操作時,core1
此時是空閑的,然而,當存在多個未執行執行緒時,核心會切換到另一個執行緒開始執行,直到thread1
完成了IO操作,這種方式可以最大化利用資源,提升多執行緒時的表現,
所以,在我們的第一個求和任務中,我們使用了比核心更多的執行緒數量沒有獲得效率提升,是因為浪費了過多的資源在背景關系切換上,但是這里,8個執行緒提高了執行效率,我們從中可以學到,選擇執行緒的數量,取決于IO操作頻率和時間占用,IO操作占比越高,就需要越多的執行緒來提高執行效率,
執行緒內部是怎樣作業的?
在我們繼續研究虛擬執行緒前,必須要知道執行緒有哪些分類,以及他們怎么作業,
通常,現在作業系統中有兩種不同的執行緒:核心執行緒以及用戶執行緒
1. 核心執行緒
通常也叫做系統執行緒,核心執行緒通常由作業系統內核來安排管理,每個內核中的執行緒執行緒有一個TCB(Thread Control Block),其中包括了執行緒的優先級,狀態,以及其它配置資訊,核心執行緒是重量級的,需要系統呼叫來創建,調度,以及同步,
2. 用戶執行緒
用戶執行緒一般使用用戶執行緒庫進行管理和調度,不需要作業系統內核的干涉,內核不能意識到用戶執行緒的變化,每個用戶執行緒代表了一個應用中不同的資料結構,包括執行緒的狀態資訊和配置資訊,用戶執行緒是輕量級的,創建和銷毀比系統執行緒更快,但是,依然會收到一些明確的限制,例如不能夠享受到多處理器或者多核的優秀性能,
簡單講,當一個行程啟動時,會啟動一個默認執行緒,執行應用入口的main
方法,隨后,行程會創建自己需要的額外執行緒,用戶執行緒是不能直接執行的,必須映射到一個制定的內核執行緒,然后通過內核執行緒執行執行,用戶執行緒和內核執行緒的映射關系有以下三種:
- M:1:所有的用戶執行緒對應到一個內核執行緒上,通過庫調度器進行調度;
- 1:1:每個用戶執行緒對應一個內核執行緒;
- M:M:所有的用戶執行緒映射到了一個內核執行緒池;
Java內部執行緒實作模式
綠色執行緒(Green Thread):遠古時期,Java使用綠色執行緒模式,這個模式下,多執行緒的調度和管理有JVM完成,綠色執行緒模式才作用M:1執行緒映射模型,這里就有一個問題,Java不能夠規模化管理這種執行緒,也就無法充分發揮硬體性能,同樣的實作綠色執行緒也是一件非常有挑戰性的事情,因為它需要非常底層的支持才能夠良好運行,隨后java移除了綠色執行緒,轉而使用本地執行緒,這使得Java的執行緒執行比綠色執行緒更慢,
本地執行緒(Native Thread):從Java1.2開始從綠色執行緒切換到了本地執行緒模式,在作業系統的幫助下,JVM得以控制本地執行緒,本地執行緒的執行效率很高,但是開啟和關閉他們的資源消耗較大,這就是為什么我們現在要使用執行緒池,這個模型遵循著1:1執行緒映射,即一個Java執行緒映射到一個內核執行緒,當一個java執行緒被創建時,相應的一個對應的核心執行緒也會被創建,用來執行執行緒代碼,自此之后,本地執行緒模型的做法就延續到了今天,
當前Java執行緒模型有什么問題嗎?
上面的章節中中,我們知道Java已經使用了本地執行緒模式,讓哦我們看看這個模式有什么問題:
- Java的執行緒庫已經很老舊了;
- 只是對于本地執行緒的一個簡單包裝;
- 本地執行緒的創建和管理資源消耗較大;
- 本地執行緒需要保存他們的呼叫堆疊在記憶體中,大概2MB~20MB的預留空間,如果你有4GB記憶體,如果每個執行緒占用20MB記憶體,那么你就只能創建大概200個執行緒;
- 因為本地執行緒是一種系統資源,加載一個新的本地執行緒大概需要1毫秒;
- 背景關系切換代價昂貴,需要一個到內核的系統呼叫;
- 上面這些強制性的限制會限制執行緒創建的數量,同時會導致性能下降和過度的記憶體消耗,因為我們不能創建更多的執行緒;
- 我們不能通過增加更多的執行緒來增應用規模,因為背景關系切換和記憶體占用的代價高昂;
現實世界的例子
考慮一臺16GB記憶體的網路服務器,對于每個服務請求,都分配一個不同的執行緒,我們假設每個執行緒需要20MB記憶體空間,那么這臺機器可以支持800個執行緒,當前,后端的API一般使用REST/SOAP呼叫方式,例如資料庫操作和API資訊轉發這些IO密集型操作,由此可見,后端服務的主要是IO密集型而不是CPU密集型,
接著假設一下,一個IO操作需要100毫秒,請求執行(IO密集型)需要100毫秒,以及回傳結果也需要100毫秒,同時,當每秒有800個請求時,執行緒數得到了最大容量,
讓我們來計算一下單個請求的CPU占用時間
CPU時間 = 請求準備時間 + 回傳結果準備時間
= 0.1ms + 0.1ms
= 0.2ms
對于800個請求呢?
800個執行緒的請求時間= 800 * 0.2ms
= 160ms
受限于我們的記憶體容量,我們只能創建800個請求,也就導致了我們CPU使用率并不高
PUC使用率=160ms / 1000ms
= 16%
那么如何才能使CPU的利用率到達90%呢?
16% = 800個執行緒
90% = X個執行緒
X = 4500
但是我們當前因為記憶體的限制不能創建那么多的執行緒,除非我們能突破這個限制,擁有90G記憶體,
90G的記憶體是一個比較離譜的數字,所以說創建本地執行緒很明顯不能充分利用硬體資源,
虛擬執行緒(Virtual Thread)
虛擬執行緒是一個Java執行緒的輕量級實作版本,最早于JDK19中出現,當前仍是預覽狀態,可以通過Jvm配置項開啟,
虛擬執行緒是JVM專案loom的一部分
虛擬執行緒解決了傳遞和維護本地執行緒的瓶頸問題,同時可以用之撰寫高吞吐的并發應用,榨干硬體資源的潛力,
與本地執行緒不同,虛擬執行緒并不有作業系統控制,虛擬執行緒是一個有JVM管理的用戶態執行緒,對比于本地執行緒的高資源占用,每個虛擬執行緒只需要幾個位元組的記憶體空間,這是的它更適合控制管理大量的用戶訪問,或者說處理IO密集型任務,
在創建虛擬執行緒的數量上幾乎沒有限制,甚至可以創建一百萬個,因為虛擬執行緒并不需要來自內核的系統呼叫,
在虛擬執行緒如此輕量化的條件下,執行緒池不再成為必須品,只需要在需要的時候盡情創建虛擬執行緒就好,
虛擬執行緒和傳統的本地執行緒操作完全兼容,例如本地執行緒變數,同步塊,執行緒中斷,等等,
虛擬執行緒如何作業
JVM管理著一個本地執行緒的執行緒池,一個虛擬執行緒想要進行CPU操作時,就把自己關聯到一個池中本地執行緒的佇列中,當虛擬執行緒中的CPU操作執行完畢后,JVM會自動解除關聯并掛起該虛擬執行緒,同時切換到并執行另一個虛擬執行緒,這就是為什么我們可以創建很多的虛擬執行緒,并且他們是如此的輕量級,
JVM使用M:N來完成虛擬執行緒與本地執行緒的映射,
Java虛擬執行緒實體
- 在現存的執行緒使用新的
ofVirtual()
工廠方法:
for (int i = 0; i < 5; i++) {
Thread vThread = Thread.ofVirtual().start(() -> System.out.println("Hellow World!!!"));
}
- 使用新的
Executors
工廠的newVirtualThreadExecutor()
方法:
public static void main(String[] args) throws InterruptedException {
var executor = Executors.newVirtualThreadPerTaskExecutor();
for (int i = 0; i < 16; i++) {
executor.submit(()-> System.out.println("Hello World!!!"));
}
executor.awaitTermination(1, TimeUnit.SECONDS);
System.out.println("Finished");
}
綠色執行緒 VS 虛擬執行緒
執行緒型別 | 簡介 | 映射 |
---|---|---|
綠色執行緒 | 在一個系統執行緒上運行多個綠色執行緒 | M:1 |
平臺執行緒(Java當前使用) | 系統執行緒的包裝 | 1:1 |
虛擬執行緒 | 在多個系統執行緒中運行多個虛擬執行緒 | M:N(M>N) |
總結
總而言之,虛擬執行緒的新特性先對于傳統多執行緒擁有很多優勢,通過在用戶空間提供的輕量化并發模型,虛擬執行緒使得撰寫并發程式更容易,使得大規模的執行緒并發成為可能,
參考
[1] screencapture-pradeesh-kumar-medium-an-era-of-virtual-threads-java
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/554337.html
標籤:其他
下一篇:返回列表