主頁 > 後端開發 > 線上問題排查回答(轉載)

線上問題排查回答(轉載)

2023-04-28 07:57:59 後端開發

面試官:「你是怎么定位線上問題的?」

這個面試題我在兩年社招的時候遇到過,前幾天面試也遇到了,我覺得我每一次都答得中規中矩,今天來梳理復盤下,下次又被問到的時候希望可以答得更好,

下一次我應該會按照這個思路去答:

1、如果線上出現了問題,我們更多的是希望由監控告警發現我們出了線上問題,而不是等到業務側反饋,所以,我們需要對核心介面做好監控告警的功能,

2、如果是業務代碼層面的監控報警,那我們應該是可以很快地定位出是哪兒的問題,畢竟告警邏輯都是我們寫的嘛,如果是服務器資源/所依賴的中間件告警,那我們可能就要花點時間去排查啦,

3、不管怎么樣,無論是系統告警還是是業務側反饋系統或者介面出了問題,我們要想想在近期有沒有發布過系統,如果近期發布過系統,判斷能不能立馬回滾到上一個版本,恢復系統平穩正常運行(在線上環境下,可用性是相當重要的),回滾的時候要考慮介面有無依賴性,是否需要跟業務側同步此次的回滾以及做相關的配合,

4、因為線上大多數的問題都來源于系統的變更,可能我們只是變更了很少的代碼,但只要有一絲的邏輯沒留意到,就真的很可能會導致出現問題,回滾很可能是最快能恢復線上正常運行的辦法,

5、如果近期都沒發布過系統,是系統告的警,那追蹤下告警和報錯日志,應該是可以很快地就能定位出問題,

6、如果不是系統告的警,是業務側反饋出了問題,那這時候需要業務側明確是哪個具體的功能/介面出了問題,有沒有保留請求入參,有沒有回傳錯誤的資訊,有何現象

7、知道了問題的現象之后,就需要根據經驗排查可能是哪塊出了問題了,我的經驗一般是:先查存盤側有沒有瓶頸(MySQL 的CPU有沒有飆高,主從同步延遲是否很大,有沒有慢SQL,Redis是不是記憶體滿了,走了淘汰策略,搜索引擎有沒有慢Query),把該服務所依賴的中間件的指標看一遍,這個程序中也要去看看服務介面的QPS/RT相關的監控,如果有某項指標不對勁,那順著寫入邏輯也應該很快能看出來

8、一般到這里,大多數的問題都能查出來,可能是邏輯本身的問題,可能是請求入參導致慢查詢,可能是中間件的網路抖動,可能是突發或者例外請求的問題,

9、如果都不是,回歸到應用和機器本身的監控:應用GC的表現、機器本身的網路/磁盤/記憶體/CPU 各種的指標有沒有發現例外的情況,這里可能是需要運維側一起配合看看有沒有做過改動,

10、要是還定位不出來,看能不能復現,能復現都好說,肯定是能解決的,

11、要是不能復現,只能在懷疑的地方打上詳細的日志再好好觀察(問題定位不出來,很多時候就是日志不夠詳細,而日志在正常情況下也不應該打太多)

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/551381.html

標籤:其他

上一篇:行程

下一篇:返回列表

標籤雲
其他(158240) Python(38107) JavaScript(25396) Java(18003) C(15217) 區塊鏈(8260) C#(7972) AI(7469) 爪哇(7425) MySQL(7151) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5870) 数组(5741) R(5409) Linux(5332) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4564) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2432) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1961) Web開發(1951) HtmlCss(1928) python-3.x(1918) 弹簧靴(1913) C++(1912) xml(1889) PostgreSQL(1874) .NETCore(1855) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • 線上問題排查回答(轉載)

    面試官:「你是怎么定位線上問題的?」 這個面試題我在兩年社招的時候遇到過,前幾天面試也遇到了。我覺得我每一次都答得中規中矩,今天來梳理復盤下,下次又被問到的時候希望可以答得更好。 下一次我應該會按照這個思路去答: 1、如果線上出現了問題,我們更多的是希望由監控告警發現我們出了線上問題,而不是等到業務 ......

    uj5u.com 2023-04-28 07:57:59 more
  • 行程

    行程、輕量級行程和執行緒 行程在教科書中通常定義:行程是程式執行時的一個實體,可以把它看作充分描述程式已經執行到何種程度的資料結構的匯集。 從內核的觀點,行程的目的就是擔當分配系統資源(CPU時間、記憶體等)的物體。 當一個行程被創建時,他幾乎于父行程相同。它接受父行程地址空間的一個(邏輯)拷貝,并從進 ......

    uj5u.com 2023-04-28 07:54:32 more
  • WPF教程_編程入門自學教程_菜鳥教程-免費教程分享

    教程簡介 WPF(Windows Presentation Foundation)是微軟推出的基于Windows 的用戶界面框架,屬于.NET Framework的一部分。它提供了統一的編程模型、語言和框架,真正做到了分離界面設計人員與開發人員的作業;同時它提供了全新的多媒體互動用戶圖形界面。 WP ......

    uj5u.com 2023-04-27 10:22:35 more
  • SpringBoot SpringSecurity 介紹(基于記憶體的驗證)

    SpringBoot 集成 SpringSecurity + MySQL + JWT 附原始碼,廢話不多直接盤 SpringBoot已經為用戶采用默認配置,只需要引入pom依賴就能快速啟動Spring Security。 目的:驗證請求用戶的身份,提供安全訪問 優勢:基于Spring,配置方便,減少大 ......

    uj5u.com 2023-04-27 10:09:09 more
  • 從原理聊JVM(三):詳解現代垃圾回收器Shenandoah和ZGC

    現代的垃圾回收器為了低停頓的目標可謂將“并發”二字玩到極致,Shenandoah在G1基礎上做了非常多的優化來使回收階段并行,而ZGC直接采用了染色指標、NUMA等黑科技,目的都是為了讓Java開發者可以更多的將精力放在如何使用物件讓程式更好的運行,剩下的一切交給GC,我們所做的只需享受現代化GC技... ......

    uj5u.com 2023-04-27 10:05:14 more
  • SpringBoot SpringSecurity 介紹(基于記憶體的驗證)

    SpringBoot 集成 SpringSecurity + MySQL + JWT 附原始碼,廢話不多直接盤 SpringBoot已經為用戶采用默認配置,只需要引入pom依賴就能快速啟動Spring Security。 目的:驗證請求用戶的身份,提供安全訪問 優勢:基于Spring,配置方便,減少大 ......

    uj5u.com 2023-04-27 10:05:02 more
  • 淺談errgroup的使用以及原始碼分析

    本文講解的是golang.org/x/sync這個包中的errgroup 1、errgroup 的基礎介紹 學習過 Go 的朋友都知道 Go 實作并發編程是比較容易的事情,只需要使用go關鍵字就可以開啟一個 goroutine。那對于并發場景中,如何實作goroutine的協調控制呢?常見的一種方式 ......

    uj5u.com 2023-04-27 07:29:54 more
  • boot-admin整合Quartz實作動態管理定時任務

    淄博燒烤爆紅出了圈,當你坐在八大局的燒烤攤,面前是火爐、烤串、小餅和蘸料,音樂響起,啤酒倒滿,燒烤靈魂的party即將開場的時候,你系統中的Scheduler(除錯器),也自動根據設定的Trigger(觸發器),從容優雅的啟動了一系列的Job(后臺定時任務)。作業一切早有安排,又何須費心勞神呢?因為 ......

    uj5u.com 2023-04-27 07:29:47 more
  • Android監聽事件

    監聽事件 ? 監聽事件機制由事件源,事件和事件監聽器三類物件組成,事件源一般就是activity中的UI控制元件。 下面參考別人整理的圖來更加形象的表達這些關系。 ? 事件監聽機制的意義就是讓事件源的行為委托給事件監聽器,讓監聽器控制事件的發生。 ? 1.實作監聽事件的方法 [ ] 通過內部類實作 [ ......

    uj5u.com 2023-04-27 07:29:38 more
  • Django筆記三十一之全域例外處理

    本文首發于公眾號:Hunter后端 原文鏈接:Django筆記三十一之全域例外處理 這一篇筆記介紹 Django 的全域例外處理。 當我們在處理一個 request 請求時,會盡可能的對介面資料的格式,內部呼叫的函式做一些例外處理,但可能還是會有一些意想不到的漏網之魚,造成程式的例外導致不能正常運行 ......

    uj5u.com 2023-04-27 07:29:30 more