Python機器學習實戰

Name: Python機器學習實戰
Price: 358 TWD
Availability: OnlineOnly
Author: 呂雲翔，王淥汀，袁琪，張凡，韓雪婷
ISBN: 7302576416

呂雲翔，王淥汀，袁琪，張凡，韓雪婷

預覽內頁

出版商: 清華大學
出版日期: 2021-05-01
定價: $359
售價: $358
語言: 簡體中文
頁數: 228
裝訂: 平裝
ISBN: 7302576416
ISBN-13: 9787302576419
相關分類: Machine Learning

下單後立即進貨 (約4週~6週)

商品描述

本書以機器學習算法為主題，詳細介紹算法的理論細節與應用方法。全書共19章，分別介紹了邏輯回歸與最大熵模型、k-近鄰模型、決策樹模型、樸素貝葉斯模型、支持向量機模型、集成學習框架、EM算法、降維算法、聚類算法、神經網絡模型等基礎模型或算法，以及8個綜合項目實例：汽車運動學片段分類、垃圾信息識別、乳腺癌識別、波士頓房價預測、生成動漫人物、鳶尾花分類、人臉識別、保險行為數據用戶分類器。本書重視理論與實踐相結合，希望為讀者提供全面而細致的學習指導。本書適合機器學習初學者、相關行業從業人員以及高等院校電腦科學、軟件工程等相關專業的師生閱讀。

作者簡介

呂雲翔,
1986-1992：北方交通大學講師； 1992-1994：比利時VUB大學應用信息技術碩士； 1994-1996：比利時VUB大學MBA； 1996-2003： IT公司項目經理2003-至今：北航軟件學院副教授。
已出版二十幾本教材（其中“計算機導論實踐教程”一書獲北航2010年教學成果三等獎；

目錄大綱

第1章機器學習概述
*源下載
1.1機器學習的組成
1.2分類問題及回歸問題
1.3監督學習、半監督學習和無監督學習
1.4生成模型及判別模型
1.5模型評估
1.5.1訓練誤差及泛化誤差
1.5.2過擬合及欠擬合
1.6正則化
1.7Scikitlearn模塊
1.7.1數據集
1.7.2模型選擇

第2章邏輯回歸及優選熵模型
2.1線*回歸
2.1.1一元線*回歸
2.1.2多元線*回歸
2.2廣義線*回歸
2.2.1邏輯回歸
2.2.2多分類邏輯回歸
2.2.3交叉熵損失函數
2.3優選熵模型
2.3.1優選熵模型的導出
2.3.2優選熵模型與邏輯回歸之間的關係
2.4評價指標
2.4.1混淆矩陣
2.4.2準確率
2.4.3**率與召回率
2.4.4PR曲線
2.4.5ROC曲線與AUC曲線
2.5實例：基於邏輯回歸實現乳腺癌預測

第3章k近鄰算法
3.1k值的選取
3.2距離的度量
3.3快速檢索
3.4實例：基於k近鄰算法實現鳶尾花分類

第4章決策樹
4.1特徵選擇
4.1.1信息增益
4.1.2信息增益比
4.2決策樹生成算法CART
4.3決策樹剪枝
4.3 .1預剪枝
4.3.2後剪枝
4.4實例：基於決策樹實現葡萄酒分類

第5章樸素貝葉斯分類器
5.1極大似然估計
5.2樸素貝葉斯分類
5.3拉普拉斯平滑
5.4樸素貝葉斯分類器的極大似然估計解釋
5.5實例：基於樸素貝葉斯實現垃圾短信分類

第6章支持向量機
6.1優選間隔及超平面
6.2線*可分支持向量機
6.3線*支持向量機
6.4合頁損失函數
6.5核技巧
6.6二分類問題與多分類問題
6.6.1一對一
6.6.2一對多
6.6.3多對多
6.7實例：基於支持向量機實現葡萄酒分類

第7章集成學習
7.1偏差與方差
7.2Bagging及隨機森林
7.2.1Bagging
7.2.2隨機森林
7.3Boosting及AdaBoost
7.3.1Boosting
7.3.2AdaBoost
7.4提升樹
7.4.1殘差提升樹
7.4.2GBDT
7.4.3XGBoost
7.5Stacking
7.6實例:基於梯度下降樹實現波士頓房價預測

第8章EM算法及其應用
8.1Jensen不等式
8.2EM算法
8.3高斯混合模型GMM
8.4隱馬爾可夫模型
8.4.1計算觀測概率的輸出
8.4.2估計隱馬爾可夫模型的參數
8.4.3隱變量序列預測
8.5實例：基於高斯混合模型實現鳶尾花分類

第9章降維
9.1主成分分析
9.1.1方差即協方差的無偏估計
9.1.2實例：基於主成分分析實現鳶尾花數據降維
9.2奇異值分解
9.2.1奇異值分解的構造
9.2.2奇異值分解用於數據壓縮
9.2.3SVD與PCA的關係
9.2.4奇異值分解的幾何解釋
9.2.5實例：基於奇異值分解實現圖片壓縮

第10章聚類
10.1距離度量
10.1.1閔可夫斯基距離
10.1.2餘弦相似度
10.1.3馬氏距離
10.1.4漢明距離
10.2層次聚類
10.3KMeans聚類
10.4KMedoids聚類
10.5DBSCAN
10.6實例：基於KMeans實現鳶花聚類

第11章神經網絡與深度學習
11.1神經元模型
11.2多層感知機
11.3損失函數
11.4反向傳播算法
11.4.1梯度下降法
11.4.2梯度消失及梯度**
11.5捲積神經網絡
11.5 .1捲積
11.5.2池化
11.5.3網絡架構
11.6循環神經網絡
11.7生成對抗網絡
11.8圖捲積神經網絡
11.9深度學習發展
11.10實例：基於捲積神經網絡實現手寫數字識別
11.10.1MNIST數據集
11.10 .2基於捲積神經網絡的手寫數字識別

第12章實戰：基於KMeans算法的汽車行駛運動學片段的分類
12.1樣本聚類
12.1.1SSE
12.1.2輪廓分析
12.2汽車行駛運動學片段的提取
12.3基於KMeans的汽車行駛運動學片段分類

第13章實戰：從零實現樸素貝葉斯分類器用於垃圾信息識別
13.1算法流程
13.2數據集加載
13.3樸素貝葉斯模型
13.3.1構造函數設計
13.3.2數據預處理
13.3.3模型訓練
13.3.4測試集預測
13.3.5主函數實現

第14章實戰：基於邏輯回歸算法進行乳腺癌的識別
14.1數據集加載
14.2Logistic模塊
14.3模型評價

第15章實戰：基於線*回歸、決策樹和SVM進行鳶尾花分類
15.1使用Logistic實現鳶尾花分類
15.2使用決策樹實現鳶尾花分類
15.3使用SVM實現鳶尾花分類

第16章實戰：基於多層感知機模型和隨機森林模型的波士頓房價預測
16.1使用MLP實現波士頓房價預測
16.2使用隨機森林模型實現波士頓房價預測

第17章實戰：基於生成式對抗網絡生成動漫人物
17.1生成動漫人物任務概述
17.2反捲積網絡
17.3 DCGAN
17.4基於DCGAN的動漫人物生成

第18章實戰：基於主成分分析法、隨機森林算法和SVM算法的人臉識別問題
18.1數據集介紹與分析
18.2LBP算子
18.3提取圖片特徵
18.4基於隨機森林算法的人臉識別問題
18.5基於SVM算法的人臉識別問題

第19章實戰：使用多種機器學習算法實現基於用戶行為數據的用戶分類器
19.1基於機器學習的分類器的技術概述
19.2工程數據的提取聚合和存儲
19.2.1數據整合的邏輯流程
19.2 .2Sqoop數據同步
19.2.3基於Hive的數據倉庫
19.2.4基於Azkaban的數據倉庫的調度任務
19.2.5數據倉庫的數據集成和數據清洗
19.2.6整合後的數據表
19.3數據展示和分析
19.3.1數據集的選取和業務背景的描述
19.3.2各維度信息詳細說明
19.3.3各維度數據的描述*統計
19.3.4各維度數據的可視化
19.4特徵工程
19.4.1標準化
19.4.2區間縮放
19.4.3歸一化
19.4.4對定*特徵進行onehot編碼
19.4.5缺失值填補
19.4.6數據傾斜
19.5模型訓練和結果評價
19.5.1構造模型思路
19.5.2模型訓練的流程
19.5.3K-Fold交*驗* <*r> 19.6各分類器模型的訓練和結果評價
19.6.1利用Python的sklearn包進行模型訓練的過程梳理
19.6.2邏輯斯諦分類模型的訓練和結果評價
19.6.3**近鄰算法模型的訓練和結果評價
19.6.4線*判*分析模型的訓練和結果評價
19.6.5樸素貝葉斯算法的模型的訓練和結果評價
19.6.6決策樹模型的訓練和結果評價
19.6.7支持向量機模型的訓練和結果評價
19.7模型提升——集成分類器
19.7.1Boosting提升算法
19.7.2AdaBoost提升算法
19.7.3AdaBoost實現過程及實驗結果