學習swoole需要的前置知識
學習一項新的技術,最重要的就why、what、how,
這門技術是什么,為什么用它,要怎么用它,這篇檔案的作用就是為了解釋what與why,
php-fpm與swoole的異同
- 常駐記憶體
- php-fpm模式為什么慢?
- swoole的運行方式
同步與異步
- 什么是同步
- 什么是異步
cpu背景關系切換
事件回圈--異步是如何實作的
總結
php-fpm與swoole的異同
常駐記憶體
一個請求通過nginx轉發到php來運行,中間是通過php-fpm來溝通連接的,通過一種叫cgi
的協議來通信,
在php-fpm還未出現之前,php一般都是通過php-cgi
這個php官方組件來與web server進行通信的,它的特點是每次運行都需要重新加載一次php.ini中的配置,并且每有一個請求都會重新啟動一個行程來執行,執行完畢后再銷毀掉,
這種方式每次都會重新決議php.ini、重新載入全部擴展,并重新初始化全部資料結構,這無疑是對cpu性能的浪費行為,于是就出現了fast cgi
,
fast cgi
的應用體現便是php-fpm,通過一個master行程管理多個worker行程的方式,在主行程啟動時便將php.ini中的配置等資訊載入記憶體,worker行程創建時會繼承master行程的資料,并且worker行程處理完一個請求后不會銷毀,而是繼續等待下一個請求,所以只需要一次加載,php.ini與擴展和初始化資料這部分的性能便被節省出來了,雖然php.ini的配置初始化被節省掉了,但是我們平時使用的laravel等php開發框架中同樣有冗長的ioc容器初始化,依賴創建的程序,這個問題php-fpm就無能為力了,
那么說完了php-fpm,這些和swoole又有什么關系呢?相同點就在于,swoole也是常駐記憶體的,也是一個master管理多個worker行程,所以也節省掉了多次載入php.ini等配置的消耗,
并且,
由于swoole本身就是一個PHP擴展,它的啟動是在php腳本內開始的,因此可以看做是php開發框架的一部分,那么php框架初始化的那一系列重復初始化便同樣被節省掉了,
這便是swoole高性能的原因,
swoole在宣傳上寫的是為了解決傳統php-fpm模式并發慢的問題而誕生的,那么就帶來一個問題:
php-fpm模式為什么慢?
php-fpm模式是以多行程方式來運行的,一個master行程創建并管理多個work行程,master行程只負責接收請求和回傳回應,剩下的運行作業交給work行程來執行,
也就是說每一個請求都對應一個work行程,同一時刻,服務器上有多少work行程,這臺服務器就可以處理多少的并發,
這么一看是不是覺得php-fpm的并發能力特別差?假設不考慮服務器配置
問題,默認的400個行程數同時就只能支持400的并發,
實際情況肯定沒有這么差,假設很多的腳本只需要0.001秒就處理完成了,如果所有的請求都可以快速處理的話,那么我們可以說1秒鐘的并發數就等于400*1000=40萬的并發,
這么一看是不是覺得php-fpm的性能也沒這么差了?
但是,如果你的業務資料量很大,mysql的查詢效率不高,每次請求都需要花費1秒鐘的時間才能回傳回應的話呢?
那么每秒鐘的并發數就從40W又下降回400了,
而swoole,就是為了解決這個問題所開發出來的一個php擴展,它使得每個worker行程不會因為1秒鐘的io阻塞而白白讓cpu浪費1秒鐘的性能,
swoole的運行方式
按照剛剛的那個例子來解釋的話,swoole的處理方式就是在一個worker行程開始進行mysql io查詢的時候就將這個請求任務暫時掛起,立馬開始執行下一個請求,然后等到第一個請求中的mysql io資料回傳之后,再切換回第一個請求中繼續執行代碼回傳回應,這樣一來,對于cpu來說,它一直在執行代碼,沒有因為請求中mysql的1秒io耗時處于空閑狀態,
那么,既然那1秒的io耗時沒有對cpu產生影響,那么對于服務器來說,每一秒鐘的并發數和之前一樣仍然是40W,只不過由于每個請求還是有1秒的耗時,所以單個請求的回應時間依然是1秒鐘,但是對于cpu來說,它每秒處理的請求數量并沒有減少,因為對于cpu來說一個請求的io耗時是1秒,1000個請求的總耗時依舊是1秒,
同步與異步
什么是同步
我們平時撰寫的php代碼就是同步代碼,php解釋器一行一行的編譯運行我們的代碼,碰到資料庫查詢,或者第三方介面呼叫,或者系統磁盤讀寫,這些不歸php當前行程管轄的部分都是io操作,它們可能是磁盤io,可能是網路io,而同步的代碼一旦碰到這些io操作,它們就會停下來等待,等待mysql回傳查詢結果,等待第三方介面回傳回應,等待linxu檔案系統回傳磁盤讀取結果,在等待的程序中,cpu的性能就被浪費掉了,
什么是異步
異步代碼就是說代碼在運行到一個需要等待的io操作時,不在原地傻等,而是繼續向下執行其他代碼,等到io操作有回傳結果通知的時候再回過頭來執行處理邏輯,
一個簡單的例子就是js中的Ajax,下面這個例子當中,js把Ajax請求發送出去就開始執行下一行代碼了,所以是先alert 2,然后等到Ajax回應回傳再執行回呼函式alert1,
$.ajax({
url:"http://www.test.com/get_data",
success: function (result) {
alert(1);
}
});
alert(2);
對于生活中的例子來說,異步就是一個人同時使用洗衣機洗衣服與使用電飯煲做飯,假設洗衣機洗一次衣服要40分鐘,電飯煲煮飯也需要40分鐘,那么這兩件事都完成需要多長時間呢?
是的,也是40分鐘(最多多出一些把衣服和米分別放進機器的可以忽略不計的時間),因為人把衣服放進洗衣機就可以去做其他事了,不會守在洗衣機旁傻等,可以去開電飯煲了,而洗衣機洗好衣服以后,會有滴滴聲提示人衣服已經洗好了,
回到一開始那個swoole并發數的例子,那些需要1秒鐘來查詢mysql資料的請求,它們的那1秒io操作也沒有讓cpu進行傻等,所以對于cpu來說,io操作已經無法影響它的并發數了,因為它始終在作業,并沒有浪費等待時間,
決議一下,如果使用異步的方式,那么會有兩個比較關鍵的點:
- 發起io操作,添加回呼函式
- 等任務完成后執行回呼函式
異步編程完全沒有浪費cpu一點性能,那如果所有的io耗時操作都用異步操作會怎么樣呢?
了解node.js的朋友可能經常聽見一個詞回呼地獄
,
前端開發中很少會有人在Ajax中嵌套Ajax,但是如果你想通過異步的方式來提升代碼的性能,那么不可避免的,只要你的程式中有多個io操作,那它們就會向下面這段代碼一樣變成層層嵌套,很快這段代碼就變得不可維護了,甚至是修改的時候都會讓人十分頭疼,
login(user => {
getStatus(status => {
getOrder(order => {
getPayment(payment => {
getRecommendAdvertisements(ads => {
setTimeout(() => {
alert(ads)
}, 1000)
})
})
})
})
})
而swoole的出現,就是為了解決同步代碼浪費性能的問題,讓同步執行的代碼變為異步執行,同時使用協程降低異步回呼編程時的心智負擔,
cpu背景關系切換
現在的電腦,一邊寫代碼,一邊查檔案,一邊聽音樂都是很常見的,因為cpu 的核心數很多可以同時做好幾件事,但是你在一開始學習for回圈的時候一定聽老師說過,當年的單核cpu寫回圈一定要小心,因為一旦出現死回圈了,那么整臺電腦都會卡死只能重啟了,
cpu在執行代碼的時候是同步的,所以理論上來講同一時刻只能做一件事,哪怕不進行死回圈,按理說之前的老電腦也沒辦法做到同時寫代碼與查檔案以及聽音樂這些事才對,并且就算是現在的四核八核cpu,那我也是可以同時開十幾個網頁,同時播放視頻的,
讓單核cpu同時運行多任務的魔法就是背景關系切換
了,主要的原理就是cpu在同時進行玩游戲與播放音樂時,先運行一會游戲,然后馬上切到音樂程式上運行一會,不斷地在這些應用之間來回切換運行,因為cpu的計算速度是遠超人腦反應時間的,所以在人類眼中,這些應用就像是在同時運行一樣,
那到底什么是背景關系
呢?就是程式運行中所需要的資料,包括存盤在記憶體中的,以及cpu多級暫存器中的這些資料,在執行緒與行程切換的時候,需要把這些資料保存起來,等到它們恢復運行的時候再把資料讀取回行程來運行,
本文主要是介紹swoole的,swoole的重點在于異步與協程,為什么要提到背景關系切換
呢?因為不論是多行程、多執行緒還是協程,它們本質上都需要用到背景關系切換
來實作的,
多行程模式,是由系統來決定每個行程的運行分片時長,而多執行緒由于它們一定有一個父級行程,所以每個執行緒的運行分片時長則是由行程來決定的,這也是為什么多執行緒語言的教程里都會提到不是執行緒開的越多越好的原因,多執行緒會有執行緒爭搶和系統調度的開銷,同時,由于cpu同一段時間內運算速度的總量是固定的,所以執行緒只需要盡量把cpu空閑的算力占滿就好,開過多的執行緒反而會因為增加系統執行緒調度開銷造成業務部分執行緒性能的下降,
那么協程與多執行緒多行程又有什么不同呢?通過實體來對比:
- php-cgi便是多行程的一種體現,每個請求對應一個cgi行程,帶來的缺點是行程頻繁創建銷毀的開銷以及每次都需要加載php.ini配置的性能浪費,
- php-fpm多行程模式的改良,通過master/worker的模式,讓多行程少了重新加載配置與頻繁創建銷毀行程的開銷,
- 假設php有多執行緒,省略多次php.ini的加載,省略多次開發框架初始化,相應的帶來執行緒調度開銷,多執行緒搶占式模型需要注意資料訪問的執行緒安全,需要給資料加鎖,并帶來鎖爭搶與死鎖問題,
- 協程,省略多次php.ini加載,省略多次開發框架初始化,由于協程是用戶態的執行緒,所以由代碼來控制什么時候進行切換,沒有執行緒調度開銷,并且swoole以同步的方式撰寫異步代碼,協程的切換由底層調度器自行切換,開發者無需關注執行緒鎖與死鎖問題,
swoole的協程切換是基于io來調度的,也就是說它只會在遇到io操作的時候才會進行切換,通過節省io等待時間來提高服務器性能,因此swoole的協程是無法進行并發計算的,不過遇到需要并行計算的場景,swoole也提供了多行程的運行方式,如果需要多行程協同操作同一個資料,就需要加行程鎖了,
事件回圈--異步是如何實作的
現在我們已經知道多行程,多執行緒,協程都是異步的編程方式了,那么異步是怎么實作的呢?
這是一個大問題,先從最基礎的看起,基礎異步編程就是異步回呼模式,也就是在執行任務的同時傳入一個回呼函式,等到任務執行完畢,回呼函式自然而然的就開始運行了,類似js的Ajax一樣,發起一個Ajax請求的時候便是發起了異步任務,同時在$.ajax方法的第三個引數傳入一個匿名函式,等到后端回傳回應以后再繼續執行回呼函式中的代碼,
那么就出現了一個問題,是誰來通知當前行程異步任務已經完成了的呢?
做過im通信朋友都知道,兩個客戶端的對話除了發送訊息,最難實作的還是接收訊息,因為需要服務端主動做推送,如果不使用WebSocket的話,要實作服務端推送就只能使用長連接+輪詢的方式了,接收訊息的那一方客戶端需要每隔一段時間就請求一次服務器,看看有沒有訊息發送給自己,對于異步回呼來說,它的實作方式也是有異曲同工之處,
處理異步回呼的部分叫做事件回圈
,可以理解為每個行程有一個死回圈,不斷的查看當前有沒有待執行的任務、已經執行完需要通知的回呼,當我們進行異步任務呼叫的時候,就是向這個回圈中投遞了一個任務與對應的回呼,當任務完成的時候,回圈便把任務從監聽陣列中去除,并執行回呼,
下面來看一個簡單的事件回圈的例子,
可以看到,EventLoop類中維護了一個event陣列,用來存盤需所有需要監聽的事件,在呼叫addEventHandler
方法時,則需要將事件的型別、引數,以及回呼函式一同傳入,
當呼叫run
方法時,這個回圈就被開啟了,可以看到run
方法中是一個while死回圈,用來不斷的檢測是否有已完成的任務,而while回圈內層的foreach則是為了查看所有事件中是否有已完成的單個任務,
而processTimers
與processIOEvents
方法則代表了swoole中典型的兩種事件,io事件與定時器,由于linux系統中萬物皆檔案的特性,很多看似是網路io的功能,其實都要用到檔案系統來實作,所以processIOEvents
方法需要傳入fp檔案指標以及read與write兩種讀寫事件,例如假設我們投遞的是讀取事件,那么就呼叫fread函式來讀取檔案,并把讀取到的資料傳遞給回呼函式來執行,這就是一個事件回圈的回呼程序了,
<?php
class EventLoop
{
private $event_handlers = [];
public function addEventHandler($event_type, $handler)
{
$this->event_handlers[$event_type][] = $handler;
}
public function run()
{
while (true) {
foreach ($this->event_handlers as $event_type => $handlers) {
switch ($event_type) {
case 'timer':
$this->processTimers($handlers);
break;
case 'io':
$this->processIOEvents($handlers);
break;
// 可以根據需求添加更多事件型別
}
}
}
}
private function processTimers($handlers)
{
$now = time();
foreach ($handlers as $timer) {
if ($now >= $timer['time']) {
$timer['callback']();
if ($timer['interval']) {
$timer['time'] = $now + $timer['interval'];
} else {
unset($this->event_handlers['timer'][array_search($timer, $handlers)]);
}
}
}
}
private function processIOEvents($handlers)
{
foreach ($handlers as $io_event) {
$fp = $io_event['fp'];
$callback = $io_event['callback'];
$events = $io_event['events'];
$read = in_array('read', $events);
$write = in_array('write', $events);
if ($read) {
$read_data = https://www.cnblogs.com/wyycc/p/fread($fp, 8192);
if ($read_data) {
$callback($read_data);
} else {
unset($this->event_handlers['io'][array_search($io_event, $handlers)]);
fclose($fp);
}
}
if ($write) {
$callback();
unset($this->event_handlers['io'][array_search($io_event, $handlers)]);
fclose($fp);
}
}
}
}
// 使用示例
$loop = new EventLoop();
// 添加定時器
$loop->addEventHandler('timer', [
'time' => time() + 5,
'interval' => 0,
'callback' => function () {
echo "5 seconds have passed\n";
},
]);
// 添加 IO 事件
$fp = fopen(__FILE__, 'r');
$loop->addEventHandler('io', [
'fp' => $fp,
'events' => ['read', 'write'],
'callback' => function ($read_data = https://www.cnblogs.com/wyycc/p/null) {
if ($read_data) {
echo"read data: $read_data";
} else {
echo "io event has occurred\n";
}
},
]);
// 啟動事件回圈
$loop->run();
在理解了時間回圈以后,那么事件回圈與swoole與多行程、多執行緒、協程之間有什么關系呢?
沒錯,無論是多行程、多執行緒還是協程,它們底層都依賴事件回圈來實作異步,例如行程與執行緒之間切換的時候如何通知對應的行程與執行緒?依賴系統級事件回圈,例如協程之間多個協程的切換要如何通知對應的協程?也是依賴事件回圈,不過swoole為了降低背景關系切換帶來的消耗,沒有依賴系統級事件回圈而是自己實作了一套,swoole的協程背景關系切換都是記憶體讀取,避免了cpu暫存器、堆疊以及系統內核態與用戶態之間的切換,因此切換開銷極小,
總結
說了這么多概念,那么swoole到底是什么呢?它融合了php-fpm的結構模式,優化了單行程的性能浪費,榷訓了多執行緒的調度開銷,屏蔽了異步回呼的復雜邏輯,是一個常駐記憶體的高性能web擴展,
做一個不嚴謹的類比,你也可以認為swoole是一個語言層面實作的php-fpm,畢竟swoole也支持完全的多行程模式,這種模式下與php-fpm的運行方式大同小異,不過由于在語言層面便常駐記憶體了,所以帶來的福利便是在啟動php腳本的開發框架時,只需要一次載入便保存在記憶體中了,避免了php-fpm每個請求都重新初始化框架的性能浪費,那么同樣的由于服務常駐記憶體了,所以哪怕是在開發程序中,代碼相關的改動都需要重啟一下swoole服務,
而swoole的架構,對應下面這張圖,便是master、manager、worker的結構,在swoole服務啟動時,master行程便fork出manager行程來對worker行程進行創建和管理,master行程自己則通過reactor執行緒來接受與分發請求,master行程接收到的請求通過reactor執行緒直接發送到worker行程中,而worker行程負責對請求進行具體的處理,如果開啟了協程模式,并且代碼也是以協程的方式運行,則一個worker可能會一段時間內(例如1s)處理多個請求,因為每個請求遇到io等待時,worker便切換協程直接開始處理下一個請求了,直到io任務回傳結果,worker再切換回上一個請求將回應回傳給master行程,
swoole對性能的提升帶來的代價是編程思維的轉變,因為常駐記憶體了,所以撰寫業務代碼時,對記憶體變數的使用就需要更加小心,避免造成記憶體泄露,因為基于異步編程,所以要理解異步的思想,避免寫出同步阻塞的代碼,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/545175.html
標籤:PHP
上一篇:day06-動態SQL陳述句