機器學習技術

艾旭升,李良,李春靜

立即出貨

相關主題

商品描述

機器學習是一門多領域交叉學科,涉及概率論、統計學、矩陣論、神經網絡、電腦等多門學科。其目標是模擬人類的學習活動,從數據中獲取知識和技能,重新組織已有的知識結構,從而不斷改善系統性能。本書共9項目。項目1介紹機器學習基礎,概要介紹機器學習的發展簡史和一般步驟,以及本書涉及的方法和算法;項目2項目7討論k近鄰算法、線性回歸、決策樹、貝葉斯分類、支持向量機、集成學習等監督學習方法;項目8介紹聚類的基本知識,闡述無監督學習方法;項目9討論深度神經網絡,主要論述捲積神經網絡和循環神經網絡兩種模型。本書由大數據技術與應用專業教師和企業工程師合力打造,採用大量項目案例講解概念和算法,內容編排採用工作手冊式教材形式,項目2項目9相互獨立,學生可選擇知識點和涉及的技術,滿足不同生源定製化學習的需要。同時,華育興業科技公司開發有教材配套的實驗實訓在線平臺,將教材內容和動手實踐緊密結合起來。本書可作為高職高專院校電子信息領域相關專業的教材,也可作為相關科技人員的參考用書,以及應用型本科的實驗補充教材。

目錄大綱

項目1?項目環境的準備 任務1.1?項目相關基本概念 1.1.1?概述 1.1.2?機器學習發展簡史 1.1.3?機器學習的一般步驟 1.1.4?機器學習的主要任務 1.1.5?模型評估 1.1.6?如何選擇合適的算法 1.1.7?項目中關鍵術語 任務1.2?項目中常用模型 1.2.1?k近鄰 1.2.2?回歸 1.2.3?決策樹 1.2.4?貝葉斯分類 1.2.5?支持向量機 1.2.6?集成學習 1.2.7?聚類 1.2.8?深度神經網絡 任務1.3?Python+PyCharm環境配置 1.3.1?為什麽選用Python 1.3.2?PyCharm+Python開發環境配置 1.3.3?NumPy安裝與PyCharm引入 任務1.4?常用Python分析工具配置 1.4.1?基本知識 1.4.2?第一機器學習案例電影分類業務理解 1.4.3?應用Pandas實現電影分類數據讀取 1.4.4?應用Matplotlib實現電影分類數據可視化 1.4.5?應用Sklearn實現電影分類學習過程 1.5?項目復盤 1.6?實操練習 項目2?k近鄰回歸與分類 任務2.1?k近鄰算法概述 2.1.1?什麽是k近鄰算法 2.1.2?應用Python實現k近鄰算法 2.1.3?值的選擇與過擬合問題 任務2.2?k近鄰算法實現葡萄酒分類 2.2.1?葡萄酒數據的準備 2.2.2?應用Pandas讀取葡萄酒實驗文本數據 2.2.3?數據分佈可視化分析 2.2.4?數據清洗 2.2.5?數據標準化 2.2.6?值的選擇 2.2.7?構建完整可用的葡萄酒kNN分類器 2.2.8?結果分析 2.3?項目復盤 2.4?實操練習 項目3?線性回歸預測與邏輯回歸分類 任務3.1?項目準備 3.1.1?線性回歸基本知識 3.1.2?普通最小二乘法 3.1.3?回歸方程評估 3.1.4?欠擬合問題 3.1.5?多重共線性問題 3.1.6?嶺回歸 任務3.2?波士頓房價線性回歸預測 3.2.1?數據的準備 3.2.2?應用Pandas讀取數據 3.2.3?使用Matplotlib進行數據可視化分析 3.2.4?特徵降維處理 3.2.5?線性回歸模型降維分析 3.2.6?多項式特徵生成 任務3.3?蔦尾花邏輯回歸分類 3.3.1?邏輯回歸基本知識 3.3.2?鳶尾花邏輯回歸分類 3.3.3?性能指標ROC和AUC 3.4?項目復盤 3.5?實操練習 項目4?決策樹分類與回歸 任務4.1?決策樹構造 4.1.1?決策樹歸納算法基本策略 4.1.2?樹的劃分規則 4.1.3?樹的剪枝處理 任務4.2?鳶尾花決策樹分類 4.2.1?決策樹分類Python編程 4.2.2?鳶尾花決策樹分類深度與過擬合 4.2.3?鳶尾花決策樹分類模型與評估 任務4.3?波士頓房價決策樹回歸 4.3.1?決策樹回歸Python編程 4.3.2?波士頓房價決策樹回歸深度與過擬合 4.3.3?波士頓房價決策樹回歸模型預測與評估 4.4?項目復盤 4.5?實操練習 項目5?貝葉斯分類 任務5.1?知識準備 5.1.1?概述 5.1.2?貝葉斯推斷 5.1.3?樸素貝葉斯推斷 任務5.2?鳶尾花GaussianNB分類 5.2.1?高斯樸素貝葉斯 5.2.2?鳶尾花分類Python編程 任務5.3?郵件MultinomialNB分類 5.3.1?多項式樸素貝葉斯 5.3.2?郵件貝葉斯過濾分類 5.3.3?數據準備與停用詞表準備 5.3.4?中文切分與字符過濾及停用詞處理 5.3.5?獲取全部訓練集中單詞列表和頻次最高的單詞集 5.3.6?獲取高頻詞數據集在郵件中的頻次 5.3.7?應用MultinomialNB創建貝葉斯模型訓練數據 5.3.8?應用MultinomialNB實現未知郵件分類預測 5.4?項目復盤 5.5?實操練習 項目6?支持向量機 任務6.1?知識準備 6.1.1?基本原理 6.1.2?線性可分與線性不可分 6.1.3?二分類實現 6.1.4?硬間隔與軟間隔 6.1.5?應用GridSearchCV自動優選超參數 任務6.2?基於SVM手寫數字識別技術 6.2.1?數據的準備與業務分析 6.2.2?手寫數字圖片可視化顯示 6.2.3?應用GridSearchCV尋找高斯核最優參數 6.2.4?數字識別模型實現 任務6.3?半導體製造過程信息傳遞判定 6.3.1?準備並解析數據 6.3.2?應用Python讀取和探查數據 6.3.3?組織需要的數據 6.3.4?數據預處理 6.3.5?建立半導體製造過程智能分類模型 6.3.6?保存訓練模型和分類的結果 6.3.7?模型性能分析 6.3.8?模型性能可視化分析 6.5?項目復盤 6.6?實操練習 項目7?個體學習與集成學習 任務7.1?知識準備 任務7.2?基於kNN學習器Bagging應用 7.2.1?Bagging基本知識 7.2.2?Python鳶尾花分類編程 任務7.3?隨機森林回歸與分類 7.3.1?隨機森林基本知識 7.3.2?隨機森林波士頓房價回歸預測 7.3.3?隨機森林鳶尾花數據兩特徵組合分類 任務7.4?Boosting應用 7.4.1?Boosting基本知識 7.4.2?AdaBoost鳶尾花數據兩特徵組合分類 7.4.3?XGBoost葡萄酒分類 7.5?項目復盤 7.6?實操練習 項目8?聚類 任務8.1?知識準備 8.1.1?聚類基本知識 8.1.2?聚類中的主要問題 8.1.3?常用聚類算法 任務8.2?基於K-Means鳶尾花分類 8.2.1?基本知識 8.2.2?數據讀取 8.2.3?構建K-Means分類模型 8.2.4?K-Means模型性能評估 8.2.5?K-Means模型結果可視化 8.3?項目復盤 8.4?實操練習 項目9?深度神經網絡 任務9.1?知識準備 9.1.1?深度前饋神經網絡 9.1.2?示例:印第安人糖尿病診斷 9.1.3?捲積神經網絡 9.1.4?循環神經網絡和長短期記憶網絡 9.1.5?示例:基於LSTM的國際旅行人數預測 任務9.2?基於CNN的時間戳圖像識別 9.2.1?準備數據:從視頻圖像中分割時間數字 9.2.2?分析數據:初始化CNN的網絡結構 9.2.3?處理數據:訓練CNN的網絡參數 9.2.4?使用算法:時間戳識別算法 9.2.5?結果分析:測試CNN模型 9.3?項目復盤 9.4?實操練習