買這商品的人也買了...
-
有趣的二進制 (軟件安全與逆向分析)$234$222 -
貝葉斯方法:概率編程與貝葉斯推斷 (Bayesian Methods for Hackers: Probabilistic Programming and Bayesian Inference)$534$507 -
Deep Learning|用 Python 進行深度學習的基礎理論實作$580$458 -
Python GUI 程式設計:PyQt5 實戰$690$538 -
Flask 網頁開發, 2/e (Flask Web Development : Developing Web Applications with Python, 2/e)$580$458 -
職業駭客的告白 : 軟體反組譯、木馬病毒與入侵翻牆竊密 (暢銷回饋版)$600$468 -
Deep Learning 2|用 Python 進行自然語言處理的基礎理論實作$680$537 -
$374SRE 生存指南:系統中斷響應與正常運行時間最大化 -
$594深入理解 XGBoost:高效機器學習算法與進階 -
機器學習的數學基礎 : AI、深度學習打底必讀$580$458 -
Python 程式設計:從入門到進階應用, 3/e (附範例光碟)$450$405 -
$534深度學習與目標檢測 -
數位轉型力$420$357 -
$505人臉識別與美顏算法實戰:基於 Python、機器學習與深度學習 -
$1,010Python 科學計算和數據科學應用 : 使用 NumPy、SciPy 和 matplo, 2/e -
黑客之道 : 漏洞發掘的藝術, 2/e (Hacking: The Art of Exploitation, 2/e)$714$678 -
TinyML|TensorFlow Lite 機器學習 : 應用 Arduino 與低耗電微控制器 (Tinyml: Machine Learning with Tensorflow Lite on Arduino and Ultra-Low-Power Microcontrollers)$880$695 -
Python 機器學習 (上), 3/e (Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow, 3/e)$620$484 -
STP 行銷策略之 Python 商業應用實戰|網路爬蟲 x 機器學習 x 數據分析$520$411 -
$301IT 運維服務管理 -
強化式學習:打造最強 AlphaZero 通用演算法$780$663 -
Deep Learning 3|用 Python 進行深度學習框架的開發實作$780$616 -
$297可解釋機器學習:黑盒模型可解釋性理解指南 -
$469智能化運維實踐 — 從 Ansible 到 Kubernetes -
商業分析全攻略:用數據分析解決商業問題 (全彩)$888$844
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
大數據分析與機器學習技術已成為各行各業實現數字化變革的關鍵驅動力。
本書以功能強大且較易上手的Python語言為編程環境,
全面講解了大數據分析與機器學習技術的商業應用實戰。
全書共16章,講解了線性回歸模型、邏輯回歸模型、決策樹模型、
樸素貝葉斯模型、K近鄰算法模型、隨機森林模型、AdaBoost與GBDT模型、
XGBoost與LightGBM模型、PCA(主成分分析)模型、聚類與分群模型
(KMeans與DBSCAN算法)、協同過濾算法模型、Apriori關聯分析模型、
神經網絡模型等十餘種機器學習模型的原理和代碼實現,
每種模型都配有一到兩個典型案例,涵蓋金融、營銷、醫療、
社會科學、企業辦公與管理等多個領域。
本書適合具備一定數學知識和編程基礎、
希望快速在工作中應用大數據分析與機器學習技術的讀者閱讀,
也適合Python編程愛好者或對大數據分析與機器學習技術感興趣的讀者參考。
目錄大綱
1章 Python與數據科學
1.1 大數據分析與機器學習概述
1.1.1 大數據分析與機器學習的應用領域
1.1.2 機器學習的基本概念
1.1.3 Python在數據科學中的作用
1.2 Python編程環境部署與基本操作
1.2.1 Python的安裝
1.2.2 Pycharm的安裝與設置
1.2.3 Jupyter Notebook的使用
1.3 Python基礎知識概要
第2章 數據分析利器:NumPy、pandas與Matplotlib庫
2.1 NumPy庫基礎
2.1.1 NumPy庫與數組
2.1.2 數組與列表的區別
2.1.3 創建數組的幾種方式
2.2 pandas庫基礎.
2.2.1 二維數據表格DataFrame的創建
2.2.2 Excel工作簿等文件的讀取和寫入
2.2.3 數據的選取與處理
2.2.4 數據表拼接
2.3 Matplotlib庫基礎
2.3.1 基本圖表繪製
2.3.2 數據可視化常用技巧
2.4 案例實戰:股票數據讀取與K 線圖繪製
2.4.1 初步嘗試:股票數據讀取與可視化
2.4.2 進階實戰:股票K 線圖繪製
第3 章 線性回歸模型
3.1 一元線性回歸
3.1.1 一元線性回歸的數學原理
3.1.2 一元線性回歸的代碼實現
3.1.3 案例實戰:不同行業工齡與薪水的線性回歸模型
3.2 線性回歸模型評估
3.2.1 模型評估的編程實現
3.2.2 模型評估的數學原理
3.3 多元線性回歸
3.3.1 多元線性回歸的數學原理和代碼實現
3.3.2 案例實戰:客戶價值預測模型
第4 章 邏輯回歸模型
4.1 邏輯回歸模型的算法原理
4.1.1 邏輯回歸模型的數學原理
4.1.2 邏輯回歸模型的代碼實現
4.1.3 邏輯回歸模型的深入理解
4.2 案例實戰:客戶流失預警模型
4.2.1 案例背景
4.2.2 數據讀取與變量劃分
4.2.3 模型的搭建與使用
4.3 模型評估方法:ROC 曲線與KS 曲線
4.3.1 ROC 曲線的基本原理
4.3.2 案例實戰:用ROC 曲線評估客戶流失預警模型
4.3.3 KS 曲線的基本原理
4.3.4 案例實戰:用KS 曲線評估客戶流失預警模型
第5 章 決策樹模型
5.1 決策樹模型的基本原理
5.1.1 決策樹模型簡介
5.1.2 決策樹模型的建樹依據
5.1.3 決策樹模型的代碼實現
5.2 案例實戰:員工離職預測模型
5.2.1 模型搭建
5.2.2 模型預測及評估
5.2.3 決策樹模型可視化呈現及決策樹要點理解
5.3 參數調優:K 折交叉驗證與GridSearch 網格搜索
5.3.1 K 折交叉驗證
5.3.2 GridSearch 網格搜索
第6 章 樸素貝葉斯模型
6.1 樸素貝葉斯模型的算法原理
6.1.1 一維特徵變量下的貝葉斯模型
6.1.2 二維特徵變量下的貝葉斯模型
6.1.3 n 維特徵變量下的貝葉斯模型
6.1.4 樸素貝葉斯模型的簡單代碼實現
6.2 案例實戰:腫瘤預測模型
6.2.1 案例背景
6.2.2 數據讀取與劃分
6.2.3 模型的搭建與使用
第7 章 K 近鄰算法
7.1 K 近鄰算法的原理和代碼實現
7.1.1 K 近鄰算法的基本原理
7.1.2 K 近鄰算法的計算步驟
7.1.3 K 近鄰算法的代碼實現
7.2 案例實戰:手寫數字識別模型
7.2.1 案例背景
7.2.2 手寫數字識別的原理
7.2.3 手寫數字識別的代碼實現
7.3 圖像識別原理詳解
第8 章 隨機森林模型
8.1 隨機森林模型的原理和代碼實現
8.1.1 集成模型簡介
8.1.2 隨機森林模型的基本原理
8.1.3 隨機森林模型的代碼實現
8.2 案例實戰:股票漲跌預測模型
8.2.1 股票基本數據獲取
8.2.2 股票衍生變量生成
8.2.3 多因子模型搭建
8.2.4 模型使用與評估
8.2.5 參數調優
8.2.6 收益回測曲線繪製
第9 章 AdaBoost 與GBDT 模型
9.1 AdaBoost 算法原理
9.1.1 AdaBoost 算法的核心思想
9.1.2 AdaBoost 算法的數學原理概述
9.1.3 AdaBoost 算法的數學原理舉例
9.1.4 AdaBoost 算法的簡單代碼實現
9.2 AdaBoost 算法案例實戰:信用卡精準營銷模型
9.2.1 案例背景
9.2.2 模型搭建
9.2.3 模型預測及評估
9.2.4 模型參數介紹
9.3 GBDT 算法原理
9.3.1 GBDT 算法的核心思想
9.3.2 GBDT 算法的數學原理概述
9.3.3 GBDT 算法的數學原理舉例
9.3.4 GBDT 算法的簡單代碼實現
9.4 GBDT 算法案例實戰:產品定價模型
9.4.1 案例背景
9.4.2 模型搭建
9.4.3 模型預測及評估
9.4.4 模型參數介紹
10 章 機器學習神器:XGBoost 與LightGBM 算法
10.1 XGBoost 算法原理
10.1.1 XGBoost 算法的核心思想
10.1.2 XGBoost 算法的數學原理概述
10.1.3 XGBoost 算法的簡單代碼實現
10.2 XGBoost 算法案例實戰1:金融反欺詐模型
10.2.1 案例背景
10.2.2 模型搭建
10.2.3 模型預測及評估
10.2.4 模型參數調優
10.3 XGBoost 算法案例實戰2:信用評分卡模型
10.3.1 案例背景
10.3.2 多元線性回歸模型
10.3.3 GBDT 回歸模型
10.3.4 XGBoost 回歸模型
10.4 LightGBM 算法原理
10.4.1 LightGBM 算法的核心思想
10.4.2 LightGBM 算法的數學原理概述
10.4.3 LightGBM 算法的簡單代碼實現
10.5 LightGBM 算法案例實戰1:客戶違約預測模型
10.5.1 案例背景
10.5.2 模型搭建
10.5.3 模型預測及評估
10.5.4 模型參數調優
10.6 LightGBM 算法案例實戰2:廣告收益回歸預測模型
10.6.1 案例背景
10.6.2 模型搭建
10.6.3 模型預測及評估
10.6.4 模型參數調優
11 章 特徵工程之數據預處理
11.1 非數值類型數據處理
11.1.1 Get_dummies 啞變量處理
11.1.2 Label Encoding 編號處理
11.2 重複值、缺失值及異常值處理
11.2.1 重複值處理
11.2.2 缺失值處理
11.2.3 異常值處理
11.3 數據標準化
11.3.1 min-max 標準化
11.3.2 Z-score 標準化
11.4 數據分箱
11.5 特徵篩選:WOE 值與IV 值
11.5.1 WOE 值的定義與計算
11.5.2 IV 值的定義與計算
11.5.3 WOE 值與IV 值的代碼實現
11.5.4 案例實戰:客戶流失預警模型的IV 值計算
11.6 多重共線性的分析與處理
11.6.1 多重共線性的定義
11.6.2 多重共線性的分析與檢驗
11.7 過採樣和欠採樣
11.7.1 過採樣
11.7.2 欠採樣
12 章 數據降維之PCA
12.1 數據降維
12.1.1 PCA 的基本原理
12.1.2 PCA 的代碼實現
12.2 案例實戰:人臉識別模型
12.2.1 案例背景
12.2.2 人臉數據讀取、處理與變量提取
12.2.3 數據劃分與降維
12.2.4 模型的搭建與使用
12.3 人臉識別外部接口調用
12.3.1 baidu-aip 庫安裝
12.3.2 調用接口進行人臉識別和打分
13 章 數據聚類與分群分析
13.1 KMeans 算法
13.1.1 KMeans 算法的基本原理
13.1.2 KMeans 算法的代碼實現
13.1.3 案例實戰:銀行客戶分群模型
13.2 DBSCAN 算法
13.2.1 DBSCAN 算法的基本原理
13.2.2 DBSCAN 算法的代碼實現
13.2.3 KMeans 算法與DBSCAN 算法的對比
13.3 案例實戰:新聞聚類分群模型
13.3.1 案例背景
13.3.2 文本數據的讀取與處理
13.3.3 模型的搭建與使
13.3.4 模型優化
14 章 智能推薦系統
14.1 智能推薦系統的基本原理
14.1.1 智能推薦系統的應用場景
14.1.2 智能推薦系統的基礎:協同過濾算法
14.2 計算相似度的常用方法
14.2.1 歐氏距離
14.2.2 餘弦相似度
14.2.3 皮爾遜相關係數
14.3 案例實戰:電影智能推薦系統
14.3.1 案例背景
14.3.2 數據讀取與處理
14.3.3 系統搭建
15 章 關聯分析:Apriori 算法
15.1 關聯分析的基本概念和Apriori 算法
15.1.1 關聯分析的基本概念
15.1.2 Apriori 算法的數學演示
15.1.3 Apriori 算法的代碼實現
15.2 案例實戰:病癥關聯規則分析
15.2.1 案例背景
15.2.2 數據讀取與處理
15.2.3 關聯規則分析
16 章 深度學習初窺之神經網絡模型
16.1 深度學習基礎:神經網絡模型
16.1.1 神經網絡模型的基本原理
16.1.2 神經網絡模型的簡單代碼實現
16.2 案例實戰:用戶評論情感分析模型
16.2.1 案例背景
16.2.2 數據讀取、中文分詞、文本向量化
16.2.3 神經網絡模型的搭建與使用
