混沌工程:複雜系統韌性實現之道 Chaos Engineering: System Resiliency in Practice

Casey Rosenthal 吾真本黃帥譯譯

買這商品的人也買了...

商品描述

隨著越來越多的公司轉向構建微服務及其他形式的分佈式系統,系統的複雜性與日俱增。
雖然無法消除複雜性,但通過實踐混沌工程,可以發現系統中的漏洞,並在其影響客戶之前,避免停機事故。
本書會展現混沌工程背後的歷史,討論奠定混沌工程基礎的理論、定義和原則,
研究整個軟件行業實現混沌工程的方式,分析傳統軟件無法企及的實例,以及混沌工程實踐的未來。

作者簡介

Casey Rosenthal是Verica公司的首席執行官兼聯合創始人。
他曾是Netflix公司混沌工程團隊的工程經理,在使用分佈式系統、人工智能以及將新穎的算法和學術界知識轉化為能落地的模型方面擁有豐富的經驗。


Nora Jones是Jeli公司的首席執行官兼聯合創始人。
她是一位敬業且充滿自驅力的技術領導者和軟件工程師,對分佈式系統中人與軟件的協同工作充滿熱情。
她在2017年AWS re:Invent大會的主題演講中為混沌工程運動的發起做出了貢獻。

目錄大綱

前言1
導言:混沌工程的誕生5
第一部分搭建舞台13
第1章遇到復雜系統15
1.1思考複雜性15
1.2遇到復雜性17
1.3面對複雜性26
1.4接納複雜性29

第2章應對複雜系統30
2.1動態安全模型30
2.2複雜性的經濟支柱模型33
2.3系統化視角36

第3章原則概述37
3.1混沌工程是什麼37
3.2混沌工程不是什麼39
3.3高級原則41
3.4原則的未來45

第二部分投入實戰47
第4章Slack的災難劇場49
4.1舊系統的混沌工程改造49
4.2災難劇場52
4.3混沌工程的過程53
4.4過程如何演化59
4.5獲得管理層支持60
4.6結果60
4.7總結62

第5章谷歌DiRT :災難恢復測試63
5.1 DiRT測試的生命週期65
5.2谷歌的測試範圍77
5.3總結79

第6章微軟的多樣化故障和實驗優先級81
6.1為什麼一切都如此復雜81
6.2實驗結果的類別83
6.3故障優先級86
6.4多樣化的程度87
6.5大規模部署實驗90
6.6總結91

第7章LinkedIn心中有會員92
7.1從災難中學習93
7.2細化實驗目標93
7.3安全地進行大規模實驗95
7.4 LinkedOut實戰96
7.5總結105

第8章採納並演進混沌工程的第一資本金融公司106
8.1第一資本金融公司案例研究107
8.2設計實驗時需要注意的事項109
8.3工具鏈110
8.4團隊結構111
8.5傳播112
8.6總結113

第三部分人為因素115
第9章先見之明117
9.1混沌工程與韌性118
9.2混沌工程的步驟118
9.3混沌工程實驗的工具支持120
9.4有效的內部合作122
9.5總結127

第10章人類系統的混沌128
10.1系統中的人128
10.2工程師團隊的適應能力130
10.3付諸實踐132

第11章決策圈中的人144
11.1實驗的原因、方法和時機145
11.2總結151

第12章實驗選擇問題及解決方案152
12.1選擇實驗152
12.2可觀測性:機會來了158
12.3總結160

第四部分商業因素163
第13章混沌工程的投資回報率165
13.1減少事故所帶來的好處轉瞬即逝165
13.2 Kirkpatrick模型166
13.3投資回報率替代方案示例168
13.4附帶投資回報率169
13.5總結170

第14章將心態、科學和混沌開放171
14.1協作心態171
14.2開放科學與開放源代碼173
14.3總結176

第15章混沌成熟度模型177
15.1採用度177
15.2複雜性182
15.3總結186

第五部分持續演進189
第16章持續驗證191
16.1持續驗證從何而來191
16.2持續驗證系統的類型193
16.3持續驗證示例:ChAP 194
16.4持續驗證的未來用例197

第17章介入信息物理系統199
17.1信息物理系統的興起200
17.2功能安全遇上混沌工程200
17.3信息物理系統的軟件203
17.4混沌工程超越FMEA 204
17.5探針效應206
17.6總結208

第18章當HOP遇上混沌工程210
18.1什麼是HOP 210
18.2 HOP的主要原則210
18.3 HOP遇上混沌工程212
18.4總結215

第19章數據庫的混沌工程216
19.1為什麼我們需要混沌工程216
19.2應用混沌工程218
19.3檢測故障222
19.4自動化混沌工程223
19.5總結226

第20章安全混沌工程的案例227
20.1現代安全手段228
20.2安全混沌工程與現有方法231
20.3安全Game Day 233
20.4安全混沌工程工具示例:ChaoSlingr 234
20.5總結236

第21章結語238
作者簡介241
譯者簡介241
封面簡介242