機器學習案例實戰, 2/e

趙衛東

  • 出版商: 人民郵電
  • 出版日期: 2021-08-01
  • 定價: $359
  • 售價: 7.9$284
  • 語言: 簡體中文
  • 頁數: 260
  • 裝訂: 平裝
  • ISBN: 7115564000
  • ISBN-13: 9787115564009
  • 相關分類: Machine Learning
  • 立即出貨 (庫存 < 4)

  • 機器學習案例實戰, 2/e-preview-1
  • 機器學習案例實戰, 2/e-preview-2
機器學習案例實戰, 2/e-preview-1

買這商品的人也買了...

商品描述

機器學習已經廣泛地應用於各行各業,深度學習的興起再次推動了人工智能的熱潮。本書結合項目實踐,首先討論了主流機器學習平臺的主要特點以及機器學習的實戰難點。在此基礎上,利用主流的機器學習開源平臺TensorFlow、OpenVINO、PaddlePaddle等,通過17個實戰案例,詳細地分析了決策樹、隨機森林、支持向量機、邏輯回歸、貝葉斯網絡、聚類、捲積神經網絡、循環神經網絡、生成對抗網絡等機器學習和深度學習算法在金融、零售、汽車、電力、交通、教育等典型領域的應用。

作者簡介

趙衛東,主要負責本科生和各類研究生機器學習、大數據核心技術和人工智能(機器學習)(商務數據分析)等課程的教學,2011年紐約大學訪問學者。人工智能(機器學習)被評為上海市精品課程以及CMOOC聯盟線上線下混合式教學改革項目,獲得2013年高等教育上海市教學成果獎二等獎。
目前主要研究方向包括機器學習應用和大數據分析等。
主持國家自然科學基金2項、國家重點研發計劃子課題、上海市浦江人才以及企業合作課題等30多項目。
已在Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers,Intelligent Data Analysis,Applied Intelligence等國內外刊物和學術會議發表論文100多篇。
出版專著、教材《機器學習》《機器學習案例實戰》《Python機器學習實戰案例》等10多部。
獲得上海市2015年上海市科技進步二等獎。
CDA三級認證數據科學家,騰訊雲和百度雲機器學習認證講師。

目錄大綱

第 1章 常用機器學習平台
1.1 常用機器學習工具
1.2 TI-ONE平台概述
1.3 PySpark介紹
1.4 TI-ONE機器學習平台主要的組件
1.4.1 數據源組件
1.4.2 機器學習組件
1.4.3 輸出組件
1.4.4 模型評估組件

第 2章 銀行信用卡風險的可視化分析
2.1 Tableau簡介
2.2 客戶信用等級影響因素
2.3 客戶消費情況對信用等級的影響
2.4 客戶拖欠情況對信用等級的影響
2.5 欺詐客戶特徵分析

第3章 貸款違約行為預測
3.1 建立信用評估模型的必要性
3.2 數據準備與預處理
3.2.1 原始數據集
3.2.2 基礎表數據預處理
3.2.3 多表合併
3.3 模型選擇
3.3.1 帶正則項的Logistic回歸模型
3.3.2 樸素貝葉斯模型
3.3.3 隨機森林模型
3.3.4 SVM模型
3.4 TI-ONE整體流程
3.4.1 登錄TI-ONE
3.4.2 輸入工作流名稱
3.4.3 上傳數據
3.4.4 數據預處理
3.4.5 拆分出驗證集
3.4.6 拆分出測試集
3.4.7 模型訓練和評估
3.5 客戶細分

第4章 保險風險預測
4.1 背景介紹
4.2 數據預處理
4.2.1 數據加載與預覽
4.2.2 缺失值處理
4.2.3 屬性值的合併與連接
4.2.4 數據轉換
4.2.5 數據標準化和歸一化
4.3 多維分析
4.4 基於神經網絡模型預測保險風險
4.5 使用SVM預測保險風險

第5章 銀行客戶流失預測
5.1 問題描述
5.2 數據預處理
5.2.1 非數值特徵處理
5.2.2 數據離散化處理
5.2.3 數據篩選
5.2.4 數據分割
5.3 數據建模
5.3.1 決策樹簡介
5.3.2 構建決策樹模型
5.4 模型校驗評估
5.4.1 混淆矩陣評估
5.4.2 ROC曲線繪製
5.4.3 決策樹參數優化
5.4.4 k折交叉驗證
5.5 算法性能比較

第6章 基於深度神經網絡的股票預測
6.1 股票趨勢預測的背景和分析思路
6.2 數據提取
6.3 數據預處理
6.3.1 數據歸一化
6.3.2 加窗處理
6.3.3 分割數據集
6.3.4 標籤獨熱編碼轉化
6.4 模型訓練
6.5 算法評估
6.6 算法比較

第7章 保險產品推薦
7.1 保險產品推薦的流程
7.2 數據提取
7.2.1 上傳原始文件
7.2.2 讀取訓練集和檢驗集
7.3 數據預處理
7.3.1 去重和合併數據集
7.3.2 缺失值處理
7.3.3 特徵選擇
7.3.4 類型變量獨熱編碼
7.3.5 數值變量規範化
7.3.6 生成訓練集和檢驗集
7.4 構建保險預測模型
7.5 模型評估

第8章 零售商品銷售預測
8.1 問題分析
8.2 數據探索
8.2.1 上傳原始數據
8.2.2 數據質量評估
8.3 數據預處理
8.3.1 填補缺失值
8.3.2 修正異常值
8.3.3 衍生字段
8.3.4 類型變量數值化和獨熱編碼化
8.3.5 數據導出
8.4 建立銷售量預測模型
8.4.1 線性回歸模型
8.4.2 Ridge回歸模型
8.4.3 Lasso回歸模型
8.4.4 Elastic Net回歸模型
8.4.5 決策樹回歸模型
8.4.6 梯度提升樹回歸模型
8.4.7 隨機森林回歸模型
8.5 模型評估

第9章 汽車備件銷售預測
9.1 數據理解
9.2 數據分析流程
9.2.1 設置數據源
9.2.2 數據預處理
9.2.3 建模分析與評估
9.3 聚類分析

第 10章 火力發電廠工業蒸汽量預測
10.1 確定業務問題
10.2 數據理解
10.3 工業蒸汽量的預測建模過程
10.3.1 設置數據源
10.3.2 數據預處理
10.3.3 建模分析與評估

第 11章 圖片風格轉化
11.1 CycleGAN原理
11.2 圖片風格轉化整體流程
11.2.1 設置數據源
11.2.2 數據預處理
11.2.3 模型訓練
11.2.4 驗證模型參數以及測試集
11.2.5 模型測試——轉化圖片風格
11.3 運行工作流
11.4 算法比較
11.4.1 CycleGAN與pix2pix模型
11.4.2 CycleGAN與DistanceGAN模型
11.5 使用TensorFlow實現圖片風格轉化

第 12章 人類活動識別
12.1 問題分析
12.2 數據探索
12.3 數據預處理
12.4 模型構建
12.5 模型評估

第 13章 GRU算法在基於Session的推薦系統的應用
13.1 問題分析
13.2 數據探索與預處理
13.2.1 數據變換
13.2.2 數據過濾
13.2.3 數據分割
13.2.4 格式轉換
13.3 構建GRU模型
13.3.1 GRU概述
13.3.2 構建GRU推薦模型
13.4 模型評估

第 14章 人臉老化預測
14.1 問題分析與數據集簡介
14.2 圖片編碼與GAN設計
14.3 模型實現
14.4 實驗分析

第 15章 出租車軌跡數據分析
15.1 數據獲取
15.2 數據預處理
15.3 數據分析
15.3.1 出租車區域推薦以及交通管理建議
15.3.2 城市規劃建議

第 16章 城市聲音分類
16.1 數據準備與探索
16.2 數據特徵提取
16.3 構建城市聲音分類模型
16.3.1 使用MLP訓練聲音分類模型
16.3.2 使用LSTM與GRU網絡訓練聲音分類模型
16.3.3 使用CNN訓練聲音分類模型
16.4 聲音分類模型評估
16.4.1 MLP網絡性能評估
16.4.2 LSTM與GRU網絡性能評估
16.4.3 CNN性能評估

參考文獻