數據可視化分析與實踐
曾秋梅 蘇斌 王偉 朱飛鴿
- 出版商: 人民郵電
- 出版日期: 2026-01-01
- 售價: $540
- 語言: 簡體中文
- ISBN: 7115676550
- ISBN-13: 9787115676559
-
相關分類:
Data-visualization
尚未上市,歡迎預購
相關主題
商品描述
在信息爆炸的時代,數據可視化作為有效理解和利用數據的方式,能將覆雜數據轉化為直觀圖形,以洞察數據規律和趨勢。本書是一份實用的數據可視化分析與實戰指南,分為三大部分。第一部分講解理論基礎,從數據可視化基本概念出發,介紹圖表類型、設計原則及相關工具,接著闡述數據采集方法、預處理環節(清洗、集成、規約與轉換),還介紹多種數據分析方法,幫助讀者建立紮實的理論基礎。第二部分聚焦DataEase工具,對從安裝部署、數據源管理,到圖表制作、儀表板設計等環節的操作要點進行詳盡闡述,助力讀者掌握該工具。第三部分通過銷售駕駛艙分析、《全唐詩》可視化分析、全球商業開源洞察分析3個實際案例,介紹數據可視化在不同場景中的應用,提升讀者實戰能力。
本書適合對數據可視化感興趣,希望系統學習其基礎理論,掌握DataEase工具使用方法,並通過實際案例提升實戰能力的初學者以及有一定基礎的讀者閱讀。
作者簡介
曾秋梅,華東師範大學工程師。主講《數據分析與大數據》、《數據處理與管理》等多門課程;參與編著多本大學生教材;多次指導學生參加中國大學生計算機設計大賽並獲獎;多年擔任上海市高等學校信息技術水平考試的命題教師。
蘇斌,華東師範大學工程師。長期從事程序設計類課程實驗教學,研究方向為數據驅動的計算教育學、大規模在線教育系統,參編多本大學計算機通識課程教材,譯有《加速:高效能軟件交付之道》等。
王偉,華東師範大學教授,CCF傑出會員,工業和信息化部電子標準院開源治理標準總體組組長,聯合國咨商開源創新專委會秘書長。牽頭制定中國首套開源治理系列標準,研究聚焦數據驅動的計算教育學與AI供應鏈治理。入選國家級創新人才項目、獲國家級教學成果二等獎、上海開源創新卓越成果獎特等獎。
朱飛鴿,飛致雲東區副總經理,培訓認證中心負責人。國家級全民數字素養與技能培訓基地認證講師,天工開物開源基金會"開源創新計劃"企業優秀導師,杭州科技職業技術學院阿裏巴巴數字經濟產業學院產業導師
目錄大綱
第 一部分 理論基礎
第 1章
數據可視化概述 3
1.1 數據可視化的基礎知識 4
1.1.1 數據與數據可視化 4
1.1.2 數據可視化的過程 6
1.2 數據可視化圖表 9
1.2.1 常用的數據可視化圖表 9
1.2.2 數據可視化設計原則 13
1.3 數據可視化工具 14
1.3.1 Excel 14
1.3.2 ECharts 15
1.3.3 AntV 16
1.3.4 Tableau 17
1.3.5 DataEase 17
第 2章 數據采集 19
2.1 數據采集概述 20
2.1.1 數據的來源 20
2.1.2 數據采集的方法 20
2.1.3 數據源和數據集 22
2.2 常用數據集的獲取 22
2.2.1 常用數據集 22
2.2.2 數據集獲取方法 26
第3章 數據預處理 27
3.1 數據預處理概述 28
3.1.1 “混亂”的數據 28
3.1.2 數據預處理的主要環節 28
3.2 數據清洗 29
3.2.1 一致性檢查 29
3.2.2 缺失值處理 31
3.2.3 噪聲數據 32
3.3 數據集成 35
3.3.1 屬性匹配 36
3.3.2 屬性冗余 39
3.4 數據規約與數據轉換 39
3.4.1 數據規約 39
3.4.2 數據轉換 40
第4章 數據分析 42
4.1 數據分析基礎 43
4.1.1 數據類型 43
4.1.2 數據思維 44
4.1.3 數據分析方法論 45
4.2 數據分析方法 47
4.2.1 描述性分析法 47
4.2.2 對比分析法 50
4.2.3 結構分析法 52
4.2.4 漏鬥分析法 53
4.2.5 相關性分析法 55
4.2.6 預測分析法 57
第二部分 DataEase實操
第5章 初識DataEase 63
5.1 DataEase 簡介 64
5.1.1 產品介紹 64
5.1.2 系統架構 66
5.2 安裝部署 69
5.2.1 桌面端部署 69
5.2.2 Linux服務器端部署 70
5.2.3 Windows 服務器端部署 73
5.2.4 離線升級 78
5.2.5 命令行工具 78
第6章 數據源 80
6.1 數據源介紹 81
6.2 本地文件(Excel)數據源 82
6.2.1 新建數據源 82
6.2.2 替換數據 86
6.2.3 追加數據 86
6.3 MySQL數據源 87
6.3.1 新建數據源 87
6.3.2 編輯數據源 91
6.4 API數據源 91
第7章 數據集 97
7.1 單表數據集 98
7.2 自定義SQL數據集 100
7.3 多表關聯數據集 103
7.4 數據集管理 106
7.4.1 基礎管理 106
7.4.2 新建計算字段 107
7.5 定時同步 111
7.5.1 數據連接管理 112
7.5.2 任務管理 115
第8章 DataEase圖表制作 119
8.1 圖表制作通用步驟 120
8.2 指標類圖表 123
8.2.1 指標卡 123
8.2.2 儀表盤 124
8.3 表格 127
8.3.1 匯總表 127
8.3.2 透視表 128
8.4 線/面圖 131
8.4.1 基礎折線圖 131
8.4.2 面積圖 132
8.5 柱形圖 135
8.5.1 基礎柱狀圖 135
8.5.2 堆疊柱狀圖 137
8.6 分布圖 139
8.6.1 餅圖 139
8.6.2 詞雲圖 141
8.7 關系圖 142
8.7.1 散點圖 142
8.7.2 漏鬥圖 144
第9章 儀表板設計 147
9.1 儀表板配置 148
9.1.1 覆用 148
9.1.2 批量編輯 149
9.1.3 移動端儀表板 150
9.1.4 儀表板樣式 151
9.2 儀表板交互 154
9.2.1 鉆取 154
9.2.2 聯動 156
9.2.3 跳轉 157
9.2.4 過濾組件 159
9.2.5 SQL動態參數 166
9.2.6 外部參數設置 169
9.3 儀表板設計技巧 172
9.3.1 排版布局 172
9.3.2 配色技巧 176
9.4 數據大屏介紹 182
第三部分 數據可視化分析實戰
第 10章 銷售駕駛艙分析案例 187
10.1 背景介紹和需求分析 188
10.1.1 背景介紹 188
10.1.2 需求分析 188
10.2 數據準備 188
10.2.1 數據介紹 188
10.2.2 連接數據源 189
10.2.3 新建數據集 191
10.2.4 在數據集中新建計算字段 193
10.3 數據分析和可視化 194
10.3.1 商品銷量分析 194
10.3.2 年度最強銷售門店分析 196
10.3.3 各類門店占比及毛利潤占比分析 196
10.3.4 年度銷售額和毛利潤趨勢分析 199
10.3.5 銷售額、利潤和門店數統計 201
10.3.6 儀表板設置 203
第 11章 《全唐詩》可視化分析案例 205
11.1 背景介紹和提出問題 206
11.2 數據準備 206
11.2.1 數據介紹 206
11.2.2 添加數據源和數據集 207
11.3 數據分析及可視化 207
11.3.1 誰的詩收錄得最多 207
11.3.2 描寫最多的季節是哪個 209
11.3.3 出現頻率較高的漢字有哪些 210
11.3.4 出現較多的地名有哪些 210
11.3.5 查詢組件 212
11.3.6 儀表板設置 213
第 12章 全球商業開源洞察分析案例 214
12.1 背景介紹和需求分析 215
12.1.1 開源軟件與商業開源 215
12.1.2 需求分析 215
12.2 數據準備 216
12.2.1 數據介紹 216
12.2.2 添加數據源和數據集 216
12.3 數據分析及可視化 217
12.3.1 總投資額和總投資筆數 217
12.3.2 投資金額變化趨勢 218
12.3.3 各階段的投資額占比和投資筆數占比 219
12.3.4 總投資額 Top10和總投資筆數Top10的公司 221
12.3.5 儀表板設置 221
