Python + Superset:商業智能數據分析與實戰

王國平

  • 出版商: 電子工業
  • 出版日期: 2022-02-01
  • 定價: $474
  • 售價: 8.5$403
  • 語言: 簡體中文
  • 頁數: 248
  • ISBN: 7121428652
  • ISBN-13: 9787121428654
  • 相關分類: Data Science
  • 立即出貨

買這商品的人也買了...

商品描述

本書通過實際案例深入介紹了基於Python的開源商業智能工具Apache Superset。本書立足於為企業建立一套開源免費的BI(商業智能)數據分析平臺,實現自助數據處理、數據分析、數據可視化,概述了該系統的基本情況、總體需求、解決方案和業務理解等。本書從企業BI系統建設的實際需求出發,詳細闡述了商業智能系統開發的概念、流程及相關技術,同時結合實際案例介紹了基於Apache Superset的最新且常用的商業智能技術,包括Redis、Hive、Presto、Vertica、ClickHouse、TiDB、Dremio等。

目錄大綱

第1章商業智能概述 1
1.1 商業智能簡介 1
1.1.1 商業智能的發展 1
1.1.2 商業智能的價值 3
1.1.3 商業智能的流程 4
1.2 商業智能技術 4
1.2.1 數據倉庫技術 4
1.2.2 ETL技術 6
1.2.3 數據可視化技術 6
1.3 幾個概念的比較10
1.3.1 商業智能與報表工具10
1.3.2 商業智能與數據分析11
1.3.3 商業智能與數據可視化11
第2章系統開發需求分析12
2.1 項目背景概述12
2.1.1 項目意義與需求12
2.1.2 項目目標、系統設計與階段劃分16
2.2 平台總體需求18
2.2.1 平台總體規劃19
2.2.2 平台用戶角色20
2.3 解決方案概述21
2.3.1 BI平台功能簡介21
2.3.2 BI平台總體架構22
2.4 業務數據理解23
2.4.1 表及其字段含義24
2.4.2 重要需求點闡述28
第3章系統開發相關技術31
3.1 系統主要軟件31
3.1.1 Hadoop 31
3.1.2 Python 34
3.1.3 Apache Superset 35
3.2 數據倉庫技術37
3.2.1 數據倉庫構建過程37
3.2.2 數據倉庫拉鍊算法38
3.3 Apache Superset的安裝39
3.3.1 在Docker中部署Apache Superset 39
3.3.2 在Windows下安裝Apache Superset 44
第4章Apache Superset連接數據源47
4.1 讀取本地數據47
4.1.1 讀取CSV文件47
4.1.2 讀取TXT文件51
4.2 連接關係型數據庫51
4.2.1 安裝驅動程序52
4.2.2 配置連接參數53
4.2.3 添加數據庫表58
第5章Apache Superset基礎操作61
5.1 Apache Superset可視化分析61
5.1.1 SQL Lab提取數據61
5.1.2 製作報表與看板64
5.2 Apache Superset用戶管理68
5.2.1 創建新的系統用戶68
5.2.2 刪除已有系統用戶70
5.2.3 查看用戶日誌記錄71
5.3 Apache Superset角色管理72
5.3.1 設置用戶角色類型73
5.3.2 創建新的用戶角色73
5.3.3 修改用戶角色類型75
5.4 Apache Superset看板設置與編輯77
5.4.1 Apache Superset看板設置77
5.4.2 Apache Superset看板編輯81
第6章Apache Superset前端集成開發84
6.1 前端開發概述84
6.1.1 HTML及其應用案例84
6.1.2 JavaScript及其特點88
6.2 系統參數設置89
6.3 Apache Superset前端集成實戰90
6.3.1 報表嵌入Web頁面90
6.3.2 看板嵌入Web頁面97
第7章Apache Superset系統性能優化100
7.1 系統性能優化100
7.2 搭建開發環境102
7.2.1 Redis緩存概述102
7.2.2 配置Redis環境104
7.3 集成開發實戰106
7.3.1 測試集成前看板106
7.3.2 刷新集成後看板108
第8章Apache Superset與數據倉庫109
8.1 數據倉庫概述109
8.1.1 傳統數據倉庫109
8.1.2 大數據數據倉庫111
8.2 Apache Superset集成Hive 113
8.2.1 Hive數據倉庫概述113
8.2.2 搭建Hive開發環境115
8.3 物流配送影響因素分析117
第9章Apache Superset與實時計算引擎121
9.1 實時計算引擎概述121
9.1.1 實時計算應用場景121
9.1.2 實時計算重要架構123
9.2 Apache Superset集成Presto 126
9.2.1 Presto計算引擎概述126
9.2.2 搭建Presto開發環境128
9.3 網購退貨原因分析132
9.3.1 網購退貨主要原因132
9.3.2 個人原因退貨分析134
第10章Apache Superset與列式存儲引擎136
10.1 列式存儲引擎136
10.2 Apache Superset集成Vertica 138
10.2.1 Vertica存儲引擎概述138
10.2.2 搭建Vertica開發環境140
10.3 客戶流失原因分析144
10.3.1 客戶流失主要原因144
10.3.2 客戶流失服務因素分析145
第11章Apache Superset與聯機分析處理147
11.1 聯機分析處理概述147
11.1.1 聯機分析處理特性147
11.1.2 聯機分析處理操作149
11.2 Apache Superset集成ClickHouse 150
11.2.1 ClickHouse存儲引擎概述151
11.2.2 搭建ClickHouse開發環境152
13.3 商家物流運營分析155
11.3.1 物流運營主要模式156
11.3.2 商家交貨週期分析157
第12章Apache Superset與混合事務分析處理159
12.1 混合事務分析處理159
12.1.1 混合事務分析處理概述159
12.1.2 混合事務分析處理操作161
12.2 Apache Superset集成TiDB 163
12.2.1 TiDB存儲引擎概述163
12.2.2 搭建TiDB開發環境166
12.3 物流配送溝通性168
12.3.1 物流配送溝通性概述169
12.3.2 物流配送溝通性分析169
第13章Apache Superset與數據湖引擎172
13.1 數據湖引擎172
13.1.1 數據湖引擎概述172
13.1.2 數據湖與數據倉庫173
13.2 Apache Superset集成Dremio 174
13.2.1 Dremio引擎概述175
13.2.2 搭建Dremio開發環境176
13.3 客戶流失價格因素182
13.3.1 客戶流失價格因素概述182
13.3.2 客戶流失價格因素分析182
第14章客戶細分主題分析184
14.1 客戶細分的價值及其方法184
14.1.1 客戶細分的概念184
14.1.2 客戶細分的目的185
14.1.3 客戶細分的方法185
14.2 基於客戶屬性的客戶細分187
14.2.1 提取SQL數據庫數據187
14.2.2 製作可視化分析報表188
14.2.3 基於屬性的細分看板192
14.3 基於客戶價值的客戶細分193
14.3.1 提取SQL數據庫數據193
14.3.2 製作可視化分析報表194
14.3.3 基於價值的細分看板198
14.4 基於消費行為的客戶細分199
14.4.1 RFM模型及客戶價值類型199
14.4.2 提取與清洗SQL數據200
14.4.3 製作可視化分析報表204
14.4.4 基於行為的細分看板208
14.5 對細分客戶進行營銷208
第15章客戶滿意度主題分析211
15.1 客戶滿意度概述211
15.2 客戶滿意信賴度分析214
15.3 客戶滿意專業度分析215
15.4 客戶滿意有形度分析217
15.5 客戶滿意同理度分析218
15.6 客戶滿意反應度分析220
15.7 提升客戶滿意度221
附錄A 安裝Python 3.10.0 224
附錄B 集群各節點的參數配置228
B.1 Hadoop的參數配置228
B.2 Hive的參數配置231
B.3 集群的啟動與關閉233
附錄C 數據源及其連接方式234