SQL數據分析從小白到高手
王國平
- 出版商: 化學工業
- 售價: $594
- 語言: 簡體中文
- ISBN: 7122474119
- ISBN-13: 9787122474117
-
相關分類:
SQL、Data Science
下單後立即進貨 (約4週~6週)
商品描述
在大數據時代,掌握必要的數據分析能力,將大大提升工作效率和自身競爭力。SQL是一種常用的數據分析工具,本書將詳細講解利用SQL進行數據分析及可視化的相關知識。 書中主要內容包括數據庫入門基礎,數據庫的環境、數據表操作、基礎查詢、 查詢、主要函數、視圖與索引、存儲過程、性能優化、數據可視化、分布式數據庫以及綜合實戰案例等。同時,結合時下流行的AI大模型工具,介紹了ChatGPT在SQL數據分析中的應用,幫助讀者提高效率。 本書內容豐富,采用雙色印刷,配套視頻講解,結合隨書附贈的素材邊看邊學邊練,能夠大大提高學習效率,迅速掌握SQL數據分析技能,並用於實踐。 本書適合數據分析初學者、初級數據分析師、數據庫技術人員、市場營銷人員、產品經理等自學使用。同時,本書也可用作職業院校、培訓機構相關專業的教材及參考書
目錄大綱
1數據庫入門
1.1 數據庫基礎 2
1.1.1 大模型與數據庫 2
1.1.2 十種數據庫類型 3
1.1.3 結構化查詢語言 5
1.2 三大關系型數據庫 6
1.2.1 MySQL數據庫 6
1.2.2 SQL Server數據庫 7
1.2.3 Oracle數據庫 8
1.3 如何學習數據庫 9
1.3.1 理解基本原理 9
1.3.2 熟練掌握SQL語句 11
1.4 利用ChatGPT學習數據庫 13
2搭建數據庫環境
2.1 下載及安裝MySQL 18
2.1.1 下載MySQL 18
2.1.2 安裝MySQL 18
2.1.3 驗證是否成功 18
2.2 數據庫管理工具 18
2.2.1 Navicat 18
2.2.2 DBeaver 18
2.3 大模型開發工具 18
2.3.1 Cursor 18
2.3.2 Fitten Code 18
2.4 利用ChatGPT連接數據庫 18
3數據庫基礎知識
3.1 創建及刪除數據庫 20
3.1.1 SQL創建及刪除數據庫 20
3.1.2 Navicat創建數據庫及導入數據 21
3.2 數據庫存儲引擎 22
3.2.1 什麼是存儲引擎 22
3.2.2 MySQL存儲引擎 23
3.2.3 存儲引擎的比較 26
3.3 數據庫編碼 27
3.3.1 什麼是數據庫編碼 27
3.3.2 MySQL數據庫編碼 28
3.3.3 中文亂碼及解決方案 29
3.4 數據類型與運算符 31
3.4.1 數值類型簡介 31
3.4.2 日期/時間類型 32
3.4.3 字符串類型 33
3.4.4 MySQL運算符 35
3.4.5 運算符優先級 37
3.5 利用ChatGPT創建數據庫 38
4數據表操作
4.1 創建數據表 41
4.1.1 CREATE語句 41
4.1.2 設置主鍵約束 42
4.1.3 設置外鍵約束 44
4.1.4 設置非空約束 46
4.1.5 設置 性約束 47
4.1.6 設置默認約束 49
4.1.7 設置屬性自動增加 50
4.1.8 設置編碼格式 51
4.1.9 設置存儲引擎 53
4.2 修改數據表 55
4.2.1 修改數據表名稱 55
4.2.2 修改字段數據類型 56
4.2.3 修改數據表字段 57
4.2.4 添加數據表字段 58
4.2.5 刪除數據表字段 59
4.2.6 修改存儲引擎 60
4.2.7 刪除外鍵約束 61
4.2.8 刪除關聯數據表 63
4.3 插入、 新與刪除數據 64
4.3.1 數據表插入數據 64
4.3.2 數據表 新數據 65
4.3.3 數據表刪除數據 66
4.4 利用ChatGPT操作數據表 68
4.4.1 利用ChatGPT創建數據表 68
4.4.2 利用ChatGPT修改字段 69
4.4.3 利用ChatGPT插入數據 71
4.4.4 利用ChatGPT 新數據 72
5數據庫基礎查詢
5.1 單表查詢 75
5.1.1 按 字段查詢 75
5.1.2 使用WHERE條件查詢 76
5.1.3 使用IN關鍵字範圍查詢 77
5.1.4 使用BETWEEN AND關鍵字查詢 78
5.1.5 使用DISTINCT查詢結果去重 78
5.1.6 使用LIMIT限制查詢結果數量 79
5.1.7 使用ORDER BY查詢結果排序 80
5.1.8 使用LIKE關鍵字模糊查詢 81
5.1.9 使用NOT關鍵字條件查詢 82
5.1.10 使用AND多條件且查詢 83
5.1.11 使用OR多條件或查詢 84
5.1.12 使用GROUP BY分組查詢 85
5.2 聚合查詢 86
5.2.1 SUM求和函數 86
5.2.2 AVG平均值函數 87
5.2.3 MAX 值函數 88
5.2.4 MIN 小值函數 89
5.2.5 COUNT計數函數 91
5.3 連接查詢 92
5.3.1 內連接及其案例 92
5.3.2 外連接及其案例 93
5.3.3 覆合條件連接查詢 95
5.4 利用ChatGPT進行基礎查詢 96
6數據庫 查詢
6.1 表和字段別名 100
6.1.1 使用表別名 100
6.1.2 使用字段別名 101
6.2 子查詢 102
6.2.1 ANY關鍵字子查詢 102
6.2.2 ALL關鍵字子查詢 103
6.2.3 EXISTS關鍵字子查詢 105
6.2.4 IN關鍵字子查詢 106
6.2.5 帶比較運算符子查詢 108
6.2.6 帶聚合函數子查詢 109
6.3 正則表達式查詢 110
6.3.1 以特定字符或字符串開頭 110
6.3.2 以特定字符或字符串結尾 112
6.3.3 匹配字符串任意一個字符 113
6.3.4 匹配字符串中多個字符 114
6.3.5 匹配 字符串 116
6.3.6 匹配 字符中的任意一個 117
6.3.7 匹配 字符以外的字符 118
6.3.8 字符串連續出現的次數 119
6.4 利用ChatGPT進行 查詢 121
7數據庫主要函數
7.1 數學函數 124
7.1.1 值函數 124
7.1.2 求余函數 125
7.1.3 四舍五入函數 126
7.1.4 冪函數 127
7.1.5 對數函數 129
7.1.6 取整函數 130
7.1.7 隨機數函數 131
7.1.8 三角函數 132
7.1.9 反三角函數 134
7.2 字符串函數 135
7.2.1 字符數和字符長度函數 135
7.2.2 字符連接函數 136
7.2.3 字符替換函數 137
7.2.4 字符大小寫轉換函數 139
7.2.5 字符截取函數 140
7.2.6 刪除空格函數 141
7.2.7 字符串位置函數 142
7.2.8 字符串反轉函數 144
7.3 日期時間函數 145
7.3.1 當前日期和時間函數 145
7.3.2 日期和時間計算函數 146
7.3.3 日期轉換函數 147
7.3.4 格式轉換函數 148
7.3.5 提取星期函數 149
7.3.6 其他日期函數 150
7.4 控制流程函數 153
7.4.1 IF函數 153
7.4.2 IFNULL函數 154
7.4.3 CASE函數 155
7.5 窗口函數 157
7.5.1 窗口函數概述 157
7.5.2 聚合窗口函數 158
7.5.3 排名窗口函數 161
7.5.4 分析窗口函數 163
7.6 利用ChatGPT進行函數學習 165
8視圖與索引
8.1 創建視圖 169
8.1.1 單表創建視圖 169
8.1.2 多表創建視圖 170
8.1.3 創建帶約束的視圖 171
8.2 修改視圖 173
8.2.1 修改數據表視圖 173
8.2.2 修改視圖約束 175
8.3 新視圖 176
8.3.1 新視圖記錄 176
8.3.2 插入視圖數據 178
8.3.3 刪除數據表視圖 179
8.4 索引及其操作 180
8.4.1 新表創建索引 180
8.4.2 修改表索引 182
8.4.3 刪除表索引 183
8.5 利用ChatGPT創建視圖和索引 184
9存儲過程
9.1 存儲過程概述 187
9.2 存儲過程的創建及查看 189
9.2.1 創建存儲過程 189
9.2.2 變量的使用 190
9.2.3 光標的使用 192
9.2.4 流程控制的使用 193
9.2.5 查看存儲過程 194
9.3 調用、修改及刪除存儲過程 195
9.3.1 調用存儲過程 195
9.3.2 修改存儲過程 197
9.3.3 刪除存儲過程 198
9.4 利用ChatGPT創建存儲過程 199
10數據庫性能優化
10.1 性能優化簡介 202
10.2 數據庫結構優化 203
10.2.1 選擇 合適的字段屬性 203
10.2.2 盡量把字段設置為非空 204
10.2.3 使用連接來代替子查詢 206
10.2.4 使用聯合查詢代替創建臨時表 207
10.2.5 設置事務 208
10.2.6 使用外鍵 209
10.2.7 鎖定表 211
10.2.8 使用索引 212
10.3 查詢語句優化 213
10.3.1 不使用子查詢 213
10.3.2 避免函數索引 215
10.3.3 用IN來替換OR 216
10.3.4 LIKE雙百分號無法使用到索引 217
10.3.5 讀取適當的記錄“LIMIT M,N” 218
10.3.6 避免數據類型不一致 220
10.3.7 分組統計可以禁止排序 221
10.3.8 避免隨機取記錄 222
10.3.9 禁止不必要的ORDER BY排序 223
10.3.10 批量INSERT插入 225
10.4 利用ChatGPT進行數據庫優化 226
11SQL數據可視化
11.1 圖表類型 230
11.1.1 垂直條形圖 230
11.1.2 水平條形圖 231
11.1.3 折線圖 231
11.1.4 面積圖 233
11.1.5 堆積面積圖 233
11.1.6 瀑布圖 234
11.1.7 餅圖 236
11.1.8 圓環圖 237
11.1.9 散點圖 237
11.2 Navicat數據可視化 239
11.2.1 圖表功能 239
11.2.2 創建工作區 239
11.2.3 創建數據源 241
11.2.4 創建圖表 242
11.2.5 美化圖表 244
11.3 利用ChatGPT進行可視化分析 246
12分布式數據庫
12.1 分布式數據庫概述 250
12.1.1 分布式數據庫原理 250
12.1.2 主要分布式數據庫 251
12.2 MongoDB數據庫 253
12.2.1 MongoDB數據庫概述 253
12.2.2 搭建MongoDB開發環境 256
12.2.3 MongoDB數據庫基礎操作 258
12.3 OceanBase數據庫 260
12.3.1 OceanBase數據庫概述 260
12.3.2 搭建OceanBase開發環境 262
12.3.3 OceanBase數據庫基礎操作 262
12.4 TiDB數據庫 273
12.4.1 TiDB數據庫概述 273
12.4.2 搭建TiDB開發環境 274
12.4.3 TiDB數據庫基礎操作 274
13案例:電商數據處理與分析
13.1 案例背景及分析 279
13.1.1 案例背景 279
13.1.2 RFM模型 280
13.1.3 案例數據 282
13.1.4 分析思路 283
13.2 數據清洗 284
13.2.1 創建數據表 284
13.2.2 重覆值處理 284
13.2.3 異常值處理 284
13.2.4 缺失值處理 285
13.3 用戶行為分析 285
13.3.1 用戶轉化率分析 285
13.3.2 轉化率原因分析 288
13.4 活躍用戶分析 291
13.4.1 日活躍用戶分析 291
13.4.2 周活躍用戶分析 293
13.4.3 月活躍用戶分析 293
13.5 用戶價值分析 295
13.5.1 計算R、F、M值 295
13.5.2 計算R、F、M得分 295
13.5.3 用戶價值分類 297
13.6 結論與建議 300