




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
阿里基于內(nèi)核剖析的故障分析和智能運(yùn)維實(shí)現(xiàn)目前致力于阿里超大規(guī)模數(shù)據(jù)中心的穩(wěn)定性和可靠性建設(shè),新硬件與軟件的協(xié)同設(shè)計(jì)等基礎(chǔ)技術(shù)領(lǐng)域的研發(fā)與工程化落地。主要研究領(lǐng)域包括:SOC芯片的前端構(gòu)建、仿真,電信級(jí)Linux內(nèi)核研發(fā),百萬級(jí)系統(tǒng)智能運(yùn)維,以及行業(yè)應(yīng)用的全生棧軟硬件技術(shù)及其融合應(yīng)用。曾參與中國(guó)嵌入式系統(tǒng)學(xué)科體系建設(shè),國(guó)家電網(wǎng)智能電網(wǎng)國(guó)家標(biāo)準(zhǔn)的制定。運(yùn)維的趨勢(shì)運(yùn)維的現(xiàn)狀和挑戰(zhàn)更好的運(yùn)維體驗(yàn)龍蜥運(yùn)維SIG(興趣組)運(yùn)維的趨勢(shì)?對(duì)整體運(yùn)維環(huán)境無感知,無法應(yīng)對(duì)任何的基礎(chǔ)設(shè)施運(yùn)維?存在基礎(chǔ)設(shè)施的運(yùn)維人員,運(yùn)維的成本高運(yùn)維的現(xiàn)狀和挑戰(zhàn)配置部署管理系統(tǒng)監(jiān)控社區(qū)工具不知其然只知其然而不知傳統(tǒng)運(yùn)維平臺(tái)的視角傳統(tǒng)IaaS提供商的視角客戶的應(yīng)用視角傳統(tǒng)運(yùn)維平臺(tái)的視角傳統(tǒng)IaaS提供商的視角客戶的應(yīng)用視角進(jìn)程B的內(nèi)存問題,很難讓運(yùn)維人員關(guān)聯(lián)到進(jìn)程A的寫文件操作可能引發(fā)的內(nèi)存不足告警可能引發(fā)的內(nèi)進(jìn)程B的內(nèi)存問題,很難讓運(yùn)維人員關(guān)聯(lián)到進(jìn)程A的寫文件操作可能引發(fā)的內(nèi)存不足告警可能引發(fā)的內(nèi)存訪問時(shí)延更糟的是,我們沒有辦法知道,究竟在哪個(gè)時(shí)刻會(huì)引發(fā)問題。糟糕的是,不僅僅是案例所闡述的內(nèi)存問題,糟糕的是,不僅僅是案例所闡述的內(nèi)存問題,在操作系統(tǒng)內(nèi)部網(wǎng)絡(luò)、IO、內(nèi)存、調(diào)度皆大量存在類似問題。更好的運(yùn)維體驗(yàn)實(shí)現(xiàn)診斷功能與客戶應(yīng)用表象的關(guān)聯(lián),實(shí)現(xiàn)診斷功能與客戶應(yīng)用表象的關(guān)聯(lián),基于內(nèi)核深度剖析智能一體化運(yùn)維流程監(jiān)控與深度問題診斷聯(lián)動(dòng),知其然又知所以然;集群化的大數(shù)據(jù)、AI分析,深入內(nèi)核的運(yùn)維SysOMSysOM2.0內(nèi)存診斷功能和實(shí)踐場(chǎng)景主要使用場(chǎng)景:主要使用場(chǎng)景:2.查詢OOM原因,并做出優(yōu)化改進(jìn),預(yù)主要使用場(chǎng)景:內(nèi)存大盤內(nèi)存診斷內(nèi)存大盤內(nèi)存診斷2.0-Sy2.0-SysOM診斷內(nèi)存診斷OOM診斷內(nèi)存診斷OOM2.0-Sy2.0-SysOM分析Cache內(nèi)存診斷分析Cache內(nèi)存診斷2.0-Sy2.0-SysOM常見調(diào)度問題 _______________________________應(yīng)用抖動(dòng)原因各種各樣,除應(yīng)用自身邏輯處理有缺陷外,___八___執(zhí)行過程偶爾耗時(shí)增加SysOM2.SysOM2.0功能定位:診斷系統(tǒng)負(fù)載高是由哪些進(jìn)程引起,及負(fù)載高是否對(duì)!!1.診斷系統(tǒng)負(fù)載高是否對(duì)系統(tǒng)的sys利用率、harSysOM2.SysOM2.0SysOM2.SysOM2.0SysOM2.SysOM2.0SysOMSysOM2.0事件總覽調(diào)度問題發(fā)生的頻次調(diào)度問題詳細(xì)信息SysOM2.SysOM2.0?追溯IO流量沖高來源進(jìn)程、文件、磁盤問題診斷流量分析IOIOBurst問題診斷流量分析IOIOBurst2.0——Sy2.0——SysOM?通過在文件系統(tǒng)、塊層追蹤IO,獲取更細(xì)粒度的IO流量分布信息,支持追溯IO來源?通過信息聚合分析,支持追溯bufferio實(shí)際來源SysOM2.0IOSysOM2.0IO診斷延遲分析SysOM2.0IOIO——延遲性能問題診斷延遲分析SysOM2.0IOIO——App/App/filesystem/… …iidp3dp4dp3dp4… dp:driverpoint?通過對(duì)IO鏈路追蹤,獲取IO各鏈路延遲分布?通過展開IO更多細(xì)節(jié)信息,分析進(jìn)程IO的延遲性能瓶頸SysOM2.0IOSysOM2.0IO問題SysOM2.0IOHANGHANG診斷——分析問題SysOM2.0IOHANG…}Virtio-Virtio-blk??IO未下發(fā)問題?中斷處理問題?通過提取vring特征,界定磁盤HANG或OSH
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 語文S版四年級(jí)上冊(cè)《觀潮》課件
- 龍羊峽水光互補(bǔ)電站專題報(bào)告
- 中班手工活動(dòng)《圣誕樹制作》課件
- 江蘇省徐州市銅山區(qū)2024-2025學(xué)年高一下學(xué)期4月期中英語試題(原卷版)
- 2025年湖南省長(zhǎng)沙市中考一模語文試題含答案
- 社會(huì)保障基金7財(cái)務(wù)管理
- 第二節(jié)配送運(yùn)輸方法和運(yùn)輸合理化
- 2025車間職工安全培訓(xùn)考試試題及答案(新)
- 2024-2025崗前安全培訓(xùn)考試試題高清版
- 2025公司、項(xiàng)目部、各個(gè)班組安全培訓(xùn)考試試題帶答案AB卷
- 第一輪復(fù)習(xí)八年級(jí)上第二單元 遵守社會(huì)規(guī)則 教學(xué)案
- 代理授權(quán)書模板
- 論語子路篇-論語子路篇講解課件
- 咯血-護(hù)理查房課件
- 公路工程施工現(xiàn)場(chǎng)安全檢查手冊(cè)
- 黃河上游歷史大洪水市公開課金獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件
- 激光跟蹤儀使用手冊(cè)
- 貨物采購(gòu)服務(wù)方案
- 圖紙答疑格式
- DB11-T 1322.64-2019 安全生產(chǎn)等級(jí)評(píng)定技術(shù)規(guī)范 第64部分:城鎮(zhèn)供水廠
- 《普通生物學(xué)教案》word版
評(píng)論
0/150
提交評(píng)論