第1章 數(shù)字化時代的運維現(xiàn)狀及挑戰(zhàn) 1
1.1 國內(nèi)外IT運維現(xiàn)狀分析 1
1.1.1 國外IT運維現(xiàn)狀分析 1
1.1.2 國內(nèi)IT運維現(xiàn)狀分析 3
1.2 數(shù)字化運維的價值重塑 5
1.3 數(shù)字化運維模式的挑戰(zhàn) 7
第2章 數(shù)字化運維管理體系 9
2.1 傳統(tǒng)運維管理體系模型 9
2.1.1 人員 10
2.1.2 流程 17
2.1.3 技術(shù) 20
2.1.4 資源 24
2.2 數(shù)字化運維管理體系模型 25
2.2.1 平臺化工具 26
2.2.2 高速化流程 28
2.2.3 數(shù)據(jù)化驅(qū)動 31
2.2.4 體系化度量 34
2.3 數(shù)字化運維的建設(shè)思路 38
2.3.1 運維數(shù)字化轉(zhuǎn)型的建設(shè) 38
2.3.2 運維組織的建設(shè) 40
2.3.3 運維服務(wù)管理的建設(shè) 41
2.3.4 運維工具的建設(shè) 42
2.3.5 數(shù)字化運維場景的演進 43
第3章 從運維管理到工具體系 45
3.1 從運維管理到工具體系的建設(shè)邏輯 45
3.1.1 運維管理和工具體系的關(guān)聯(lián)分析 45
3.1.2 從運維管理到工具體系的拆解模型 47
3.1.3 運維工具體系的建設(shè)方法與原則 48
3.2 工具體系的平臺化架構(gòu) 49
3.2.1 單工具領(lǐng)域 49
3.2.2 組合工具領(lǐng)域 51
3.2.3 平臺架構(gòu)抽象 59
3.2.4 數(shù)據(jù)與AI加持 61
3.2.5 實踐案例 65
第4章 數(shù)字化運維一體化平臺 67
4.1 運維一體化平臺的建設(shè)背景 67
4.1.1 業(yè)務(wù)與技術(shù)發(fā)展趨勢 67
4.1.2 互聯(lián)網(wǎng)中臺建設(shè)浪潮 69
4.1.3 運維平臺現(xiàn)狀 70
4.2 運維一體化平臺的能力要素 71
4.3 運維一體化平臺的建設(shè)路徑 73
4.3.1 平臺建設(shè)的3個階段 73
4.3.2 數(shù)據(jù)化和智能化 75
4.4 運維一體化平臺的PaaS能力 76
4.4.1 PaaS的概念 76
4.4.2 PaaS的能力 76
4.4.3 iPaaS的能力 78
4.4.4 aPaaS的能力 79
第5章 可觀測能力建設(shè) 81
5.1 可觀測體系的發(fā)展 81
5.1.1 監(jiān)控的發(fā)展歷程 81
5.1.2 可觀測理論 83
5.1.3 可觀測價值驅(qū)動 88
5.2 可觀測系統(tǒng)的建設(shè)方法 89
5.2.1 企業(yè)面臨的可觀測挑戰(zhàn) 89
5.2.2 可觀測系統(tǒng)的設(shè)計模式 90
5.2.3 可觀測系統(tǒng)的建設(shè)路徑 96
5.3 可觀測系統(tǒng)落地實踐 98
5.3.1 可觀測工具體系設(shè)計 98
5.3.2 指標監(jiān)控 104
5.3.3 日志建設(shè) 114
5.3.4 鏈路追蹤 120
5.3.5 告警閉環(huán) 125
第6章 CMDB配置管理能力建設(shè) 137
6.1 傳統(tǒng)CMDB建設(shè)方法剖析 137
6.1.1 CMDB的發(fā)展史 137
6.1.2 CMDB建設(shè)的失敗原因 138
6.2 消費驅(qū)動的CMDB建設(shè)方法 139
6.2.1 CMDB的建設(shè)原則和實現(xiàn)方法 139
6.2.2 CMDB的建設(shè)目標與范圍 140
6.2.3 與CMDB建設(shè)相關(guān)的角色和組織 141
6.2.4 CMDB模型管理 142
6.2.5 CMDB數(shù)據(jù)維護 151
6.2.6 CMDB運營與度量 159
6.2.7 CMDB工具選型 160
第7章 自動化運維能力建設(shè) 168
7.1 企業(yè)自動化運維現(xiàn)狀與需求 168
7.1.1 企業(yè)自動化運維現(xiàn)狀 168
7.1.2 企業(yè)自動化運維需求 172
7.2 自動化運維平臺設(shè)計 175
7.2.1 自動化運維平臺的設(shè)計理念 175
7.2.2 自動化運維平臺的設(shè)計 176
7.2.3 常見的自動化運維場景設(shè)計 178
7.3 多云環(huán)境自動化運維 182
7.3.1 多云環(huán)境自動化運維的主要場景 182
7.3.2 多云環(huán)境自動化運維面臨的挑戰(zhàn) 183
7.3.3 多云環(huán)境自動化運維的要點 183
7.3.4 多云環(huán)境自動化運維的實踐 186
第8章 敏捷ITSM能力建設(shè) 190
8.1 建設(shè)背景 190
8.1.1 VUCA時代的挑戰(zhàn) 190
8.1.2 ITSM現(xiàn)狀和挑戰(zhàn) 191
8.2 關(guān)于敏捷 192
8.2.1 什么是敏捷 192
8.2.2 ITIL的發(fā)展 193
8.2.3 流程敏捷化的特性 194
8.2.4 敏捷流程打通組織的經(jīng)脈 195
8.3 敏捷ITSM架構(gòu)規(guī)劃 196
8.3.1 業(yè)務(wù)設(shè)計 196
8.3.2 工具架構(gòu) 197
8.3.3 關(guān)鍵能力 198
8.4 敏捷ITSM建設(shè)路徑 199
第9章 統(tǒng)一運維門戶能力建設(shè) 200
9.1 建設(shè)背景 200
9.2 一站式與個性化 201
9.3 架構(gòu)規(guī)劃 202
9.3.1 業(yè)務(wù)設(shè)計 202
9.3.2 工具架構(gòu) 202
9.3.3 關(guān)鍵能力 203
9.4 實踐案例 205
第10章 運維管理度量指標體系設(shè)計 207
10.1 度量指標體系概述 207
10.1.1 基本概念 207
10.1.2 建設(shè)原則 208
10.1.3 建設(shè)的必要性 208
10.1.4 度量指標體系要素 209
10.2 度量指標體系的設(shè)計 213
10.2.1 運維價值度量指標 213
10.2.2 運維服務(wù)體系度量指標 215
10.2.3 運維業(yè)務(wù)管理度量指標 218
10.2.4 運維工具建設(shè)成效度量指標 219
第11章 運維可視化能力建設(shè) 231
11.1 建設(shè)背景 231
11.2 工程可視化要求 233
11.2.1 實用性和高顏值 233
11.2.2 低成本和高效率 233
11.3 工具架構(gòu)規(guī)劃 233
11.3.1 業(yè)務(wù)設(shè)計 233
11.3.2 工具架構(gòu) 233
11.3.3 關(guān)鍵能力 234
11.4 實踐案例 238
第12章 運維數(shù)據(jù)治理能力建設(shè) 242
12.1 運維數(shù)據(jù)治理的背景與收益 242
12.1.1 運維數(shù)據(jù)治理的背景 242
12.1.2 運維數(shù)據(jù)治理的收益 243
12.2 運維數(shù)據(jù)治理的方法和技術(shù)落地 244
12.2.1 運維數(shù)據(jù)治理的方法 244
12.2.2 運維數(shù)據(jù)分析場景 248
12.2.3 運維數(shù)據(jù)治理的技術(shù)落地 250
12.3 運維數(shù)據(jù)治理體系建設(shè) 256
12.3.1 運維數(shù)據(jù)治理的管理模式 256
12.3.2 運維數(shù)據(jù)治理的組織架構(gòu) 257
12.3.3 運維數(shù)據(jù)治理的管理流程 257
12.3.4 運維數(shù)據(jù)治理的技術(shù)平臺 258
12.3.5 運維數(shù)據(jù)治理的質(zhì)量管理 259
第13章 AIOps建設(shè)思路與場景應(yīng)用 261
13.1 AIOps概述 261
13.1.1 AIOps的基本概念 261
13.1.2 AIOps的發(fā)展歷程 262
13.1.3 AIOps成熟度模型 263
13.2 AIOps能力建設(shè) 268
13.2.1 AIOps整體建設(shè)思路 268
13.2.2 AIOps平臺能力建設(shè) 269
13.2.3 AIOps場景能力建設(shè) 271
13.3 AIOps實踐場景 274
13.3.1 單指標異常檢測 274
13.3.2 日志聚類 277
13.3.3 日志異常檢測 280
13.3.4 根因分析 285
13.3.5 告警關(guān)聯(lián)分析 291
13.4 AIOps未來展望 294
第14章 業(yè)務(wù)連續(xù)性保障能力建設(shè) 296
14.1 IT應(yīng)急管理能力建設(shè) 296
14.1.1 IT應(yīng)急管理的相關(guān)理論 296
14.1.2 IT應(yīng)急管理能力建設(shè)的挑戰(zhàn) 299
14.1.3 IT應(yīng)急管理的業(yè)務(wù)架構(gòu)設(shè)計 300
14.1.4 IT應(yīng)急管理平臺設(shè)計 303
14.2 重保服務(wù)能力建設(shè) 308
14.2.1 重保專項活動的背景 308
14.2.2 重保組織與過程管控 309
14.3 護網(wǎng)服務(wù)能力建設(shè) 312
14.3.1 護網(wǎng)行動的背景 312
14.3.2 護網(wǎng)行動的主要工作及痛點分析 313
14.3.3 護網(wǎng)行動的應(yīng)對方案 314
14.3.4 護網(wǎng)典型案例 315
第15章 運維管理體系轉(zhuǎn)型落地的最佳實踐 317
15.1 建設(shè)路徑 317
15.1.1 自動化階段 318
15.1.2 數(shù)據(jù)化階段 322
15.1.3 智能化階段 326
15.2 實踐方法論 329
15.2.1 設(shè)定目標 329
15.2.2 實施步驟 333
15.2.3 實施注意事項 339
第16章 運維管理體系轉(zhuǎn)型案例 344
16.1 某商業(yè)銀行研運一體化建設(shè)案例 344
16.1.1 運維轉(zhuǎn)型項目概述 344
16.1.2 繪制運維藍圖 345
16.1.3 權(quán)威的配置管理 347
16.1.4 統(tǒng)一的監(jiān)控告警 348
16.1.5 運維能力服務(wù)化 348
16.2 某能源集團研運一體化建設(shè)案例 350
16.2.1 運維轉(zhuǎn)型項目概述 350
16.2.2 建設(shè)統(tǒng)一運維平臺 351
16.2.3 建設(shè)統(tǒng)一配置管理平臺 353
16.2.4 實現(xiàn)運維的自動化 353
16.3 某高端制造企業(yè)研運一體化建設(shè)案例 355
16.3.1 運維轉(zhuǎn)型項目概述 355
16.3.2 轉(zhuǎn)型項目的量化指標 356
16.3.3 轉(zhuǎn)型項目的建設(shè)內(nèi)容 356