監控平臺解密:IT系統風險感知和洞察

薑才康 等

買這商品的人也買了...

商品描述

本書採用循序漸進的講解方式,介紹瞭如何從零開始構建一個企業級監控平臺的相關理論技術和實踐方法。首先從監控系統總體設計原理出發,逐步介紹企業級監控系統的常用架構、各個組件模塊作用、運行模式、監控體系的建設路線、監控信息的合並算法、監控顆粒度設置經驗以及如何保障監控系統自身可靠性等內容;隨後自底向上依次對硬件設備、操作系統、虛擬機、常用數據庫和中間件、容器和容器編排、系統和應用日誌以及應用鏈路等常見監控領域實施監控的技術原理、常用監控指標以及實現方式等內容作了介紹;最後對監控系統下階段發展趨勢也即智能監控作涉及相關技術原理及常用智能監控功能作了展望及介紹。通過對本書的系統學習,可以對電腦監控系統的基本原理、設計思想、實現方式等方面有全面而深入的瞭解。

目錄大綱

封面
版權信息
前摺頁
內容簡介
推薦序一
推薦序二
推薦序三
前言
第1章監控系統規劃及原理
1.1 IT監控運維管理的發展歷程
1.1.1 新興的中國市場(1985—1994年)
1.1.2 運營商大建設期(1995—2000年)
1.1.3 多元化的監控運維繫統(2001—2010年)
1.1.4 面向雲和應用(2010年至今)
1.2 監控體系總體規劃
1.2.1 IT運營體系的階段性
1.2.2 監控體系建設的階段性
1.3 監控系統的分類
1.4 監控系統工作原理
1.5 監控系統運行模式分類
1.5.1 主動/被動監控
1.5.2 有代理/無代理
1.6 監控事件總線
1.6.1 什麼是集中監控事件總線
1.6.2 事件總線的市場格局
1.6.3 監控事件總線的功能設計
本章小結
第2章計算機硬件設備監控
2.1 計算機的分類
2.2 數據中心常見的計算機種類
2.2.1 大型機
2.2.2 小型機、PC服務器
2.2.3 RISC、CISC
2.2.4 刀片機
2.3 計算機硬件設備監控
2.3.1 大型機設備監控
2.3.2 小型機設備監控
2.3.3 PC Server設備監控
2.3.4 刀片機設備監控
本章小結
第3章虛擬機監控
3.1 虛擬化分類
3.1.1 硬件虛擬化
3.1.2 桌面虛擬化
3.1.3 應用程序虛擬化
3.1.4 網絡虛擬化
3.2 ESXi虛擬化監控
3.2.1 ESXi虛擬化概述
3.2.2 ESXi架構圖及監控入口
3.2.3 使用Zabbix監控ESXi
3.3 KVM虛擬化監控
3.3.1 KVM虛擬化概述
3.3.2 使用Zabbix監控KVM
本章小結
第4章操作系統監控
4.1 操作系統的種類
4.1.1 類UNIX系統
4.1.2 Windows系統
4.2 操作系統功能模塊
4.3 CPU監控
4.3.1 CPU相關概念
4.3.2 CPU狀態
4.4 內存監控
4.4.1 內存相關概念
4.4.2 內存狀態
4.5 進程監控
4.5.1 進程相關概念
4.5.2 進程狀態監控
4.6 文件屬性監控
4.6.1 Windows中的文件屬性
4.6.2 類UNIX中的文件屬性
4.7 文件系統監控
4.7.1 文件系統概念
4.7.2 文件系統狀態
4.8 網絡模塊監控
4.9 監控系統如何監控操作系統
4.9.1 Windows
4.9.2 Linux
本章小結
第5章數據庫監控
5.1 數據庫分類
5.1.1 關係型數據庫
5.1.2 非關係型數據庫
5.2 數據庫狀態指標分類
5.3 當前連接數與最大允許連接數
5.3.1 連接數的相關概念
5.3.2 連接數指標實例
5.4 QPS/TPS
5.4.1 QPS/TPS的相關概念
5.4.2 QPS/TPS指標實例
5.5 慢查詢
5.5.1 慢查詢的相關概念
5.5.2 慢查詢指標實例
5.6 磁盤I/O監控
5.6.1 磁盤I/O相關概念
5.6.2 磁盤I/O的獲取
5.7 其他針對性指標
5.7.1 Mysql Binlog cache的相關概念
5.7.2 Mysql Binlog cache指標實例
5.7.3 Oracle表空間的概念
5.7.4 Oracle表空間指標實例
5.7.5 Mysql MHA高可用集群的概念
5.7.6 Mysql MHA高可用集群指標
5.7.7 Oracle集群的概念
5.7.8 Oracle集群指標實例
本章小結
第6章中間件監控
6.1 Nginx監控
6.1.1 Nginx概述
6.1.2 Nginx服務的進程及端口
6.1.3 服務可用性監控
6.1.4 Nginx日誌監控
6.1.5 Nginx狀態頁監控
6.2 Tomcat監控
6.2.1 Tomcat概述
6.2.2 請求吞吐量指標和延遲指標
6.2.3 線程池指標
6.2.4 Errors錯誤率指標
6.2.5 JVM內存使用情況指標
6.2.6 JVM監控工具
6.3 ActiveMQ監控
6.3.1 ActiveMQ概述
6.3.2 生產者數量監控
6.3.3 消費者數量監控
6.3.4 隊列深度監控
6.3.5 ActiveMQ監控實踐
本章小結
第7章Docker容器監控
7.1 Docker容器運行狀態
7.2 Docker容器性能指標
7.3 cAdvisor對容器監控
7.3.1 CPU的監控
7.3.2 內存的監控
7.3.3 磁盤的監控
7.3.4 網絡的監控
7.4 Docker容器內的應用日誌監控
本章小結
第8章Kubernetes監控
8.1 Kubernetes簡介
8.2 Prometheus簡介
8.3 Prometheus部署
8.4 Kubernetes集群監控
8.4.1 宿主機監控
8.4.2 容器監控
8.4.3 集群資源監控
8.4.4 API Server監控
8.4.5 應用系統監控
本章小結
第9章應用監控
9.1 應用性能管理概述
9.2 調用鏈路跟踪
9.2.1 Span的概念
9.2.2 Trace的概念
9.3 APM系統的設計與實現
9.3.1 APM系統通用架構
9.3.2 Span的創建及SpanContext的傳遞邏輯
9.3.3 TraceID和SpanID的生成方法
9.3.4 代碼注入方法
9.3.5 APM系統性能優化
本章小結
第10章日誌監控
10.1 日誌的基本概念
10.2 日誌的作用
10.2.1 運維監控
10.2.2 資源管理
10.2.3 入侵檢測
10.2.4 取證和審計
10.2.5 挖掘分析
10.3 常見日誌類型及格式
10.3.1 W3C Extended Log File格式
10.3.2 Apache access log
10.3.3 Syslog
10.4 日誌規範
10.4.1 應用日誌打印規範
10.4.2 日誌的輪轉歸檔
10.4.3 日誌的爆發抑制
10.5 日誌監控基本原理
10.5.1 前置式日誌監控
10.5.2 集中式日誌監控
10.5.3 日誌監控的基本過程
10.6 日誌監控的常見場景
10.6.1 關鍵字監控
10.6.2 多節點日誌監控
10.6.3 應用系統性能監控
10.6.4 應用系統業務量異常監控
10.6.5 安全監控與異常IP自動封禁
10.7 日誌採集與傳輸
10.7.1 拉式採集(PULL)
10.7.2 推式採集(PUSH)
10.7.3 日誌過濾
10.8 日誌解析與日誌監控策略
10.8.1 日誌解析工具
10.8.2 正則表達式
10.8.3 日誌監控策略
10.9 常見日誌監控系統
10.9.1 基於ELK的日誌監控
10.9.2 基於Splunk的日誌監控
本章小結
第11章智能監控
11.1 智能監控概述
11.1.1 Gartner AIOps
11.1.2 NoOps
11.1.3 智能監控實施路徑
11.2 監控數據治理
11.2.1 大數據平台選型
11.2.2 大數據平台設計
11.2.3 監控運維數據治理
11.3 監控動態基線
11.3.1 動態閾值設計與計算
11.3.2 基於動態閾值異常檢測
11.3.3 監控動態閾值案例
11.4 監控自愈
11.4.1 什麼是自愈
11.4.2 自癒的優勢
11.4.3 監控自愈模塊設計
11.4.4 監控自愈案例分享
本章小結
參考文獻