機器學習全解(R語言版)
黃天元
- 出版商: 人民郵電
- 出版日期: 2024-07-01
- 定價: $419
- 售價: 7.9 折 $331
- 語言: 簡體中文
- 頁數: 200
- ISBN: 7115641463
- ISBN-13: 9787115641465
-
相關分類:
Machine Learning、R 語言
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
$354神經網絡:R語言實現 -
$568金融中的機器學習 -
$602機器學習實戰:使用 R、tidyverse 和 mlr -
智能風控實踐指南:從模型、特徵到決策$539$512 -
$469深度學習:數學基礎、算法模型與實戰 -
$417基於R語言的高級深度學習 -
CPU 眼裡的 C/C++$534$507 -
RPA 開發:UiPath 入門與實戰$594$564 -
$281RPA 機器人與商務應用 -
$611數據驅動的進化優化 -
$469基於深度學習的圖像處理與實踐 -
$327圖解演算法:從基礎知識到實際應用的演算法入門書 -
$658Python 深度學習實戰 -
$505人人可懂的模式識別(原書第2版) -
群體智能算法的理論基礎$390$371 -
$706決策演算法 -
Python AI 遊戲編程入門 — 基於 Pygame 和 PyTorch$474$450 -
$509中文版MATLAB 圖形與圖像處理從入門到精通(實戰案例版) -
算法分析導論, 2/e$539$512 -
$505Python自然語言理解:自然語言理解系統開發與應用實戰 -
$331大模型時代的人工智能基礎與實踐 — 基於 OmniForce 的應用開發教程 -
$331分佈式機器學習模式 -
R語言醫學數據分析實踐$594$564 -
$356AI 圖像生成核心技術與實戰 -
基於 Python 的金融分析與風險管理 (暢享版)(基礎捲)$539$512
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
機器學習是近年來非常熱門的學科,R語言經過一段時間的發展也逐漸成為主流的編程語言之一。本書結合機器學習和R語言,面向機器學習實踐,不僅介紹了機器學習和R語言的基礎知識,而且介紹瞭如何借助不同的算法來進行模型分析,以及這些算法在R語言中的實現方式。通過閱讀本書,讀者可以快速瞭解機器學習和R語言的必備知識,掌握機器學習的實現流程。
本書適合程序員、數據分析人員、對算法感興趣的讀者、機器學習領域的從業人員及科研人員閱讀。
作者簡介
黃天元,覆旦大學博士,中國科學院博士後,現任浙江財經大學講師。熱愛數據科學與開源工具,致力於利用數據科學迅速積累行業經驗和探索科學
發現。在 CRAN 上維護4個R 語言包(累計下載量破10萬),著有《R語言數據高效處理指南》《文本數據挖掘:基於R語言》等圖書,並開設知乎專欄《R 語言數據挖掘》。
目錄大綱
第 1章 機器學習概論 1
1.1 機器學習的概念 1
1.2 機器學習的意義 2
1.3 機器學習的種類 3
1.4 機器學習基本流程 3
第 2章 R語言綜合基礎 5
2.1 簡易環境配置 5
2.2 編程保留符號 9
2.3 基本數據類型 9
2.3.1 數值型 10
2.3.2 邏輯型 10
2.3.3 字符型 11
2.3.4 因子型 11
2.3.5 類型判斷與轉換 12
2.4 常用數據結構 12
2.4.1 向量 12
2.4.2 矩陣 13
2.4.3 列表 14
2.4.4 數據框 14
2.5 程序流程控制 15
2.5.1 選擇結構 15
2.5.2 循環結構 16
2.6 函數使用技巧 18
第3章 高效數據操作 19
3.1 R數據操作包簡介 19
3.2 數據讀寫 19
3.3 管道操作符 20
3.4 基本操作 21
3.4.1 篩選列 22
3.4.2 篩選行 28
3.4.3 更新 34
3.4.4 排序 36
3.4.5 匯總 40
3.4.6 分組計算 41
3.4.7 列的重命名 44
3.5 多表連接 45
3.6 長寬轉換 50
3.7 集合運算 53
3.8 缺失值處理 55
3.9 列表列的運用 56
第4章 tidyverse快速入門 59
4.1 數據讀取(readr) 59
4.2 數據整理 61
4.2.1 批處理(purrr) 61
4.2.2 因子操作(forcats) 64
4.2.3 時間操作(lubridate) 67
4.2.4 字符串操作(stringr) 68
4.2.5 數據框清洗(tibble/dplyr/tidyr) 71
4.3 數據可視化(ggplot2) 79
第5章 探索性數據分析 82
5.1 基本概念介紹 82
5.1.1 平均值 82
5.1.2 標準差 83
5.1.3 極值 83
5.1.4 中位數 84
5.1.5 相關系數 84
5.2 探索工具實踐 86
5.2.1 vtree 86
5.2.2 skimr 88
5.2.3 naniar 90
第6章 特徵工程 93
6.1 特徵修飾 93
6.1.1 歸一化 93
6.1.2 數據分箱 94
6.1.3 缺失值填補 101
6.2 特徵構造 107
6.2.1 構造交互項 107
6.2.2 基於降維技術的特徵構造 108
6.2.3 One-Hot編碼 110
6.3 特徵篩選 111
6.3.1 過濾法 111
6.3.2 封裝法 113
6.3.3 嵌入法 114
第7章 重採樣方法 116
7.1 針對模型評估的重採樣 116
7.1.1 交叉驗證 116
7.1.2 自舉法 117
7.2 針對類失衡的重採樣 117
第8章 模型表現的衡量 119
8.1 回歸模型的表現衡量 119
8.2 分類模型的表現衡量 120
第9章 模型選擇 122
9.1 機器學習模型概覽 122
9.1.1 線性回歸 122
9.1.2 K近鄰算法(KNN) 123
9.1.3 樸素貝葉斯方法 123
9.1.4 判別分析 124
9.1.5 支持向量機 124
9.1.6 人工神經網絡 125
9.1.7 決策樹 125
9.1.8 隨機森林 126
9.1.9 梯度下降法 127
9.2 mlr3工作流簡介 127
9.2.1 環境配置 127
9.2.2 任務定義 128
9.2.3 學習器選擇 130
9.2.4 訓練與預測 131
9.3 基於mlr3的模型篩選 134
第 10章 參數調節 136
10.1 指定終止搜索條件 136
10.2 設置指定參數組合 138
10.3 範圍內網格搜索 139
10.4 範圍內隨機搜索 140
第 11章 模型分析 142
11.1 變量重要性評估 142
11.2 變量影響作用分析 146
11.3 基於個案的可加性歸因方法 149
第 12章 集成學習 152
12.1 集成學習的三種策略 152
12.1.1 裝袋法簡介 152
12.1.2 提升法簡介 152
12.1.3 堆疊法簡介 153
12.2 基於caret與caretEnsemble框架的集成學習實現 153
12.2.1 環境部署 153
12.2.2 數據準備 153
12.2.3 裝袋法 154
12.2.4 提升法 155
12.2.5 堆疊 156
第 13章 實踐案例一:基於caret包對泰坦尼克號乘客存活率進行二分類預測 161
13.1 工具簡介 161
13.2 問題背景 162
13.3 數據審視 162
13.4 特徵工程 163
13.5 數據劃分 164
13.6 模型訓練 165
13.7 模型的預測與評估 165
13.8 超參數調節 166
第 14章 實踐案例二:基於mlr框架對波士頓房價進行回歸預測 169
14.1 工具簡介 169
14.2 問題背景 169
14.3 數據審視與預處理 170
14.4 任務定義 174
14.5 建模與調參 174
14.6 模型表現比較 181
14.7 進一步的參數調節 183
14.8 模型解釋 184
第 15章 實踐案例三:基於mlr3框架對皮馬印第安人糖尿病數據集進行特徵篩選 187
15.1 工具簡介 187
15.2 問題背景 187
15.3 去除冗餘特徵 188
15.4 特徵重要性排序 190
15.5 利用封裝法對特徵進行篩選 191
第 16章 實踐案例四:基於tidymodels框架對鳶尾花進行多分類預測 193
16.1 工具簡介 193
16.2 問題背景 193
16.3 數據集劃分 194
16.4 數據預處理 195
16.5 指定重採樣方法 196
16.6 模型定義與調參 197
16.7 觀察模型在測試集的表現 199


