R語言機器學習實戰 Practical Machine Learning in R

Name: R語言機器學習實戰
Price: 568 TWD
Availability: InStock
Author: [美] 弗雷德·恩旺加（Fred Nwanganga）
ISBN: 7115583935

[美] 弗雷德·恩旺加（Fred Nwanganga）

預覽內頁

出版商: 人民郵電
出版日期: 2022-12-01
定價: $719
售價: 7.9 折 $568
語言: 簡體中文
頁數: 286
ISBN: 7115583935
ISBN-13: 9787115583932
相關分類: R 語言
此書翻譯自: Practical Machine Learning in R

立即出貨

買這商品的人也買了...

~~$800~~ $632

重構｜改善既有程式的設計, 2/e (繁中平裝版)(Refactoring: Improving The Design of Existing Code, 2/e)
$811

R語言數據可視化之美：專業圖表繪制指南 (增強版)
$469

內網安全攻防 : 滲透測試實戰指南
$250

簡單高效 LaTeX
$714

基於R語言的金融分析
~~$680~~ $612

愛上統計學：使用 R語言
~~$480~~ $379

輕鬆學習 R語言 -- 從基礎到應用，掌握資料科學的關鍵能力, 3/e
$305

機器學習入門與實戰 — 基於 scikit-learn 和 Keras
$469

機器學習編程：從編碼到深度學習
$505

機器學習與 R語言 (Machine Learning with R, 3/e)
$602

機器學習實戰：使用 R、tidyverse 和 mlr
~~$420~~ $332

【最新ITS認證版】Python 零基礎入門班 (含ITS Python國際認證模擬試題)
$296

R語言數據分析與可視化
$454

R語言數據可視化實戰 : 大數據專業圖表從入門到精通 (微視頻全解版)
$702

R語言實戰技巧精粹:350秘技大全
~~$650~~ $507

Python 從初學到生活應用超實務 (電腦視覺與AI加強版)：讓 Python 幫你處理日常生活與工作中繁瑣重複的工作
~~$630~~ $498

一步到位！Python 程式設計 -- 最強入門教科書, 3/e
~~$720~~ $562

Python 小專案大集合：提升功力的 81個簡單有趣小程式
~~$680~~ $537

PHP8 / MySQL 網頁程式設計自學聖經 (附範例/影音)
$556

從零開始學 Latex
~~$880~~ $695

Scikit-learn 詳解與企業應用：機器學習最佳入門與實戰
$796

R語言臨床預測模型實戰
~~$1,200~~ $948

AI 必須！從做中學貝氏統計 – 從事機器學習、深度學習、資料科學、大數據分析一定要懂的統計利器 (修訂第二版)
$611

R語言實戰, 3/e
$774

R語言數據可視化：科技圖表繪制

商品描述

本書探討瞭如何使用 R 語言進行機器學習，涵蓋基本的原理和方法，並通過大量的示例和練習，讓讀者掌握 R 語言的數據處理技巧。本書包括入門、回歸、分類、模型的評估和改進、無監督學習五大部分，涉及線性回歸、logistic 回歸、k 近鄰、樸素貝葉斯、決策樹、聚類和關聯規則等機器學習模型。本書配套提供相關的代碼和數據，方便讀者學習和使用。本書適合 R 語言和機器學習的愛好者、從業者以及相關院校的師生選用。

作者簡介

弗雷德·恩旺加（Fred Nwanganga）博士，美國聖母大學門多薩商學院商業分析專業助理教授，擁有超過15年的技術領導經驗。

邁克·查普爾（Mike Chapple）博士，美國聖母大學門多薩商學院信息技術、分析和運營系副教授，目前擔任該大學商業分析碩士項目的學術主任，出版了20多種書籍。

目錄大綱

第一部分　入門

第 1 章　什麼是機器學習 2

1.1　從數據中發現知識 2

1.1.1　算法介紹 3

1.1.2　人工智能、機器學習和深度學習 3

1.2　機器學習技術 4

1.2.1　監督學習 4

1.2.2　無監督學習 7

1.3　模型選擇 9

1.3.1　分類技術 9

1.3.2　回歸技術 9

1.3.3　相似性學習技術 10

1.4　評估模型 10

1.4.1　分類錯誤 11

1.4.2　回歸錯誤 12

1.4.3　錯誤類型 13

1.4.4　分割數據集 14

1.5　練習 15

第 2 章　R 和 RStudio 簡介 17

2.1　歡迎來到 R 17

2.2 R 和 RStudio 組件 18

2.2.1 R 語言 18

2.2.2 RStudio 19

2.2.3 R 包 26

2.3　編寫和運行 R 腳本 29

2.4 R 中的數據類型 31

2.4.1　向量 32

2.4.2　測試數據類型 33

2.4.3　轉換數據類型 36

2.4.4　缺失值 36

2.5　練習 37

第 3 章　數據管理 38

3.1 tidyverse 38

3.2　數據收集 39

3.2.1　主要考慮因素 39

3.2.2　導入數據 40

3.3　數據探索 43

3.3.1　數據描述 43

3.3.2　數據可視化 48

3.4　數據準備 52

3.4.1　數據清洗 53

3.4.2　數據轉換 59

3.4.3　減少數據 64

3.5　練習 69

第二部分　回歸

第 4 章　線性回歸 72

4.1　自行車租賃與回歸 72

4.2　變量之間的關系 73

4.2.1　相關性 74

4.2.2　回歸 79

4.3　簡單線性回歸 80

4.3.1　普通最小二乘法 81

4.3.2　簡單線性回歸模型 82

4.3.3　評估模型 82

4.4　多元線性回歸 85

4.4.1　多元線性回歸模型 86

4.4.2　評估模型 86

4.4.3　改進模型 93

4.4.4　優缺點 100

4.5　案例研究：預測血壓 101

4.5.1　導入數據 102

4.5.2　探索數據 102

4.5.3　簡單線性回歸模型的擬合 104

4.5.4　多元線性回歸模型的擬合 105

4.6　練習 111

第 5 章　logistic 回歸 113

5.1　尋找潛在捐贈者 113

5.2　分類 115

5.3 logistic 回歸 116

5.3.1　優勢比 117

5.3.2　二分類 logistic 回歸模型 120

5.3.3　評估模型 129

5.3.4　改進模型 135

5.3.5　優缺點 140

5.4　案例研究：收入預測 140

5.4.1　導入數據 141

5.4.2　探索和準備數據 141

5.4.3　訓練模型 144

5.4.4　評估模型 146

5.5　練習 147

第三部分　分類

第 6 章　k 近鄰 152

6.1　檢測心臟病 152

6.2 k 近鄰 154

6.2.1　發現最近鄰居 155

6.2.2　標記未標記數據 157

6.2.3　選擇合適的 k 157

6.2.4 k 近鄰模型 158

6.2.5　評估模型 162

6.2.6　改進模型 163

6.2.7　優缺點 164

6.3　案例研究：重新分析捐贈者數據集 165

6.3.1　導入數據 165

6.3.2　探索和準備數據 165

6.3.3　建立模型 169

6.3.4　評估模型 170

6.4　練習 170

第 7 章　樸素貝葉斯 171

7.1　垃圾郵件分類 171

7.2　樸素貝葉斯 172

7.2.1　概率 173

7.2.2　聯合概率 173

7.2.3　條件概率 174

7.2.4　樸素貝葉斯分類 175

7.2.5　可加性平滑 177

7.2.6　樸素貝葉斯模型 178

7.2.7　評估模型 182

7.2.8　樸素貝葉斯分類器的優缺點 183

7.3　案例研究：重新審視心臟病檢測問題 183

7.3.1　導入數據 183

7.3.2　探索和準備數據 184

7.3.3　建立模型 185

7.3.4　評估模型 186

7.4　練習 186

第 8 章　決策樹 188

8.1　預測許可證決策 188

8.2　決策樹 189

8.2.1　遞歸分區 190

8.2.2　熵 193

8.2.3　信息增益 194

8.2.4　基尼不純度 196

8.2.5　剪枝 196

8.2.6　建立分類樹模型 197

8.2.7　評估模型 200

8.2.8　決策樹的優缺點 202

8.3　案例研究：重新審視收入預測問題 203

8.3.1　導入數據 203

8.3.2　探索和準備數據 204

8.3.3　建立模型 205

8.3.4　評估模型 205

8.4　練習 206

第四部分　模型的評估和改進

第 9 章　評估模型 208

9.1　評估未來表現 208

9.1.1　交叉驗證 210

9.1.2　自助抽樣 215

9.2　超越預測準確性 217

9.2.1 Kappa 218

9.2.2　查準率和查全率 220

9.2.3　靈敏度和特異性 222

9.3　可視化模型性能 225

9.3.1　接收者操作特性曲線 225

9.3.2　曲線下麵積 228

9.4　練習 230

第 10 章　改進模型 232

10.1　調整參數 232

10.1.1　自動參數調整 232

10.1.2　自定義參數調整 236

10.2　集成方法 240

10.2.1　裝袋 241

10.2.2　提升 243

10.2.3　堆疊 245

10.3　練習 249

第五部分　無監督學習

第 11 章　用關聯規則發現模式 252

11.1　超市購物籃分析 252

11.2　關聯規則 253

11.2.1　識別強規則 254

11.2.2 Apriori 算法 255

11.3　發現關聯規則 256

11.3.1　生成規則 257

11.3.2　評估規則 260

11.3.3　優缺點 263

11.4　案例研究：識別雜貨店購買模式 263

11.4.1　導入數據 264

11.4.2　探索和預處理數據 264

11.4.3　生成規則 265

11.4.4　評估規則 266

11.5　練習 268

11.6　參考文獻 268

第 12 章　用聚類對數據分組 269

12.1　聚類 269

12.2 k 均值聚類 271

12.3　基於 k 均值聚類的大學細分 274

12.3.1　創建簇 275

12.3.2　分析簇 277

12.3.3　選擇最佳簇數 278

12.3.4 k 均值聚類的優缺點 282

12.4　案例研究：對購物中心客戶進行細分 282

12.4.1　探索和準備數據 283

12.4.2　聚類數據 283

12.4.3　評估簇 284

12.5　練習 285

12.6　參考文獻 286