Python數據挖掘實戰
方小敏
- 出版商: 電子工業
- 出版日期: 2021-01-01
- 定價: $474
- 售價: 7.9 折 $374
- 語言: 簡體中文
- 頁數: 244
- 裝訂: 平裝
- ISBN: 7121404613
- ISBN-13: 9787121404610
-
相關分類:
Data-mining
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
$327敏捷項目管理(從入門到精通實戰指南) -
$474Odoo 快速入門與實戰:Python 開發 ERP 指南 -
$509Bootstrap + Vue.js 前端開發超實用代碼集錦 -
$407Vue.js 從入門到項目實踐 (超值版) -
$454Python 科學計算及實踐 -
$454SaaS 商業實戰:好模式如何變成好生意 -
資料科學的建模基礎 : 別急著 coding!你知道模型的陷阱嗎?$599$539 -
$305機器學習入門與實戰 — 基於 scikit-learn 和 Keras -
$505深入淺出 Pandas:利用 Python 進行數據處理與分析 -
$403Python 商業數據分析:零售和電子商務案例詳解 -
資料科學的統計實務 : 探索資料本質、扎實解讀數據,才是機器學習成功建模的第一步$599$539 -
$331集成學習入門與實戰:原理、算法與應用 -
$454Vue.js 3 應用開發與核心源碼解析 -
$517機器學習應用與實戰(全彩) -
$454人工智能安全基礎 -
$331業務敏捷 打造數智時代的高適應力組織 -
$338ChatGPT : 智能對話開創新時代 -
$387從 ChatGPT 到 AIGC:智能創作與應用賦能 -
$662Amazon Web Services 雲計算實戰, 2/e -
精通 Transformer : 從零開始構建最先進的 NLP 模型$594$564 -
$658高級 Python 核心編程開啟精通 Python 編程世界之旅 -
$505python核心編程:從入門到實踐:學與練 -
$560Python 開發實例大全 上捲 -
$560Python 開發實例大全 下捲 -
$564前端工程化 : 基於 Vue.js 3.0 的設計與實踐
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
從解決工作實際問題出發,提煉總結工作中Python 常用的數據處理、數據挖掘實戰方法與技巧。本書通俗易懂地介紹數據挖掘過程中可能用到的回歸模型、分類模型、聚類、關聯、時間序列分析等技術。在不影響學習理解的前提下,盡可能地避免使用晦澀難懂的Python 編程、統計術語或模型公式。 本書定位是帶領Python 數據分析初學者入門,並能解決學習、工作中大部分的問題或需求。入門後如還需要進一步進階學習,可自行擴展閱讀相關書籍或資料,學習是永無止境的,正所謂"師傅領進門,修行在個人”。
作者簡介
方小敏,資深機器學習工程師;中山大學數字治理研究中心技術顧問;曾服務於騰訊等知名因特網企業,熟練掌握Python、R、Spark、Hive、TensorFlow等工具進行機器學習。
目錄大綱
第1章 數據挖掘基礎 /1
1.1 數據挖掘是什麼 /1
1.1.1 數據挖掘算法的類型 /2
1.1.2 數據挖掘需要的技能 /4
1.1.3 數據挖掘的常見誤區 /6
1.2 數據挖掘的常見問題 /8
1.2.1 預測問題 /9
1.2.2 分類問題 /9
1.2.3 聚類問題 /11
1.2.4 關聯問題 /12
1.3 數據挖掘的標準流程 /13
1.3.1 商業理解 /14
1.3.2 數據理解 /14
1.3.3 數據準備 /14
1.3.4 模型構建 /15
1.3.5 模型評估 /15
1.3.6 模型部署 /15
1.4 數據分析和數據挖掘的區別 /16
1.4.1 數據分析 /16
1.4.2 數據挖掘 /17
第2章 回歸模型 /18
2.1 回歸模型簡介 /18
2.2 相關分析 /20
2.2.1 依存關係 /20
2.2.2 相關係數的計算 /21
2.2.3 相關係數的方向與大小 /22
2.2.4 居民購物習慣相關分析案例 /23
2.3 簡單線性回歸分析 /25
2.3.1 線性回歸方程解讀 /25
2.3.2 使用最小二乘法求解回歸方程 /26
2.3.3 使用廣告投放費用預測銷售額案例 /28
2.4 多重線性回歸分析 /33
2.4.1 使用最小二乘法求解多重線性回歸方程 /33
2.4.2 使用廣告投放費用與客流量預測銷售額案例 /36
2.5 一元非線性回歸 /39
2.5.1 一元非線性回歸模型 /39
2.5.2 一元非線性回歸模型求解 /40
2.5.3 使用上線天數預測活躍用戶數案例 /41
第3章 分類模型 /48
3.1 分類模型基礎 /48
3.1.1 分類模型的建模五步驟 /49
3.1.2 分類模型評估指標 /50
3.1.3 K折交叉驗證 /53
3.2 KNN模型 /54
3.2.1 KNN模型原理 /54
3.2.2 使用商戶數據預測是否續約案例 /55
3.3 貝葉斯分類 /64
3.3.1 貝葉斯分類的核心概念 /65
3.3.2 樸素貝葉斯分類 /67
3.3.3 樸素貝葉斯分類算法在離散型特徵上的求解 /68
3.3.4 樸素貝葉斯分類算法在連續型特徵上的求解 /71
3.3.5 使用議員在議案上的投票記錄預測其所屬黨派案例 /83
3.3.6 根據商戶數據預測其是否續約案例 /85
3.3.7 根據新聞文本預測其所屬分類案例 /86
3.4 決策樹 /89
3.4.1 決策樹分類 /89
3.4.2 決策樹分類算法原理 /91
3.4.3 使用高中生基本信息預測其是否計劃升學案例 /93
3.4.4 案例解讀 /102
3.5 隨機森林 /104
3.5.1 隨機森林的特點 /104
3.5.2 網格搜索 /106
3.5.3 使用隨機森林算法提升決策樹算法效果案例 /107
3.6 支持向量機 /111
3.6.1 支持向量機的核心原理 /111
3.6.2 根據葡萄酒成分數據預測其分類案例 /116
3.7 邏輯回歸 /118
3.7.1 邏輯回歸的核心概念 /118
3.7.2 邏輯回歸的數學推導 /119
3.7.3 使用住戶信息預測房屋是否屋主所有案例 /120
第4章 特徵工程 /124
4.1 描述性統計分析 /125
4.2 數據標準化 /127
4.2.1 Min-Max標準化 /128
4.2.2 Z-Score 標準化 /129
4.2.3 Normalizer歸一化 /131
4.3 數據變換 /132
4.3.1 二值化 /132
4.3.2 分桶 /135
4.3.3 冪變換 /138
4.4 缺失值處理 /139
4.4.1 刪除缺失值所在的行 /140
4.4.2 均值/眾數/中值填充 /141
4.4.3 模型填充 /142
4.5 降維 /143
4.5.1 主成分分析 /143
4.5.2 因子分析 /154
第5章 聚類算法 /160
5.1 K均值算法 /161
5.1.1 K均值算法的核心概念 /161
5.1.2 電信套餐製定案例 /164
5.2 DBSCAN算法 /169
5.2.1 DBSCAN算法核心概念 /170
5.2.2 用戶常活動區域挖掘案例 /173
5.3 層次聚類算法 /175
5.3.1 演示:聚類層次的計算過程 /175
5.3.2 基於運營商基站信息挖掘商圈案例 /178
第6章 關聯算法 /184
6.1 關聯規則 /185
6.1.1 關聯規則的核心概念 /186
6.1.2 超市關聯規則挖掘案例 /188
6.1.3 超市關聯規則解讀 /192
6.2 協同過濾 /192
6.2.1 協同過濾算法的實現 /193
6.2.2 安裝scikit-surprise模塊 /196
6.2.3 基於電影數據的協同過濾案例 /197
6.3 奇異值分解 /201
第7章 時間序列 /206
7.1 時間序列分解 /206
7.1.1 非季節性時間序列分解 /207
7.1.2 季節性時間序列 /211
7.2 序列預測 /214
7.2.1 把不平穩的時間序列轉換成平穩的時間序列 /214
7.2.2 自回歸模型 /219
7.2.3 移動平均模型 /220
7.2.4 自回歸移動平均模型 /221
第8章 模型持久化 /226
8.1 保存模型 /226
8.2 恢復模型 /228
8.3 管道模型 /229
