機器學習與數據科學基於R的統計學習方法 (Machine Learning and Data Science: An Introduction to Statistical Learning Methods with R) 机器学习与数据科学:基于R的统计学习方法
古鐵雷斯 (Daniel D.Gutierrez)
- 出版商: 人民郵電
- 出版日期: 2017-06-01
- 定價: $354
- 售價: 7.9 折 $280
- 語言: 簡體中文
- 頁數: 242
- 裝訂: 平裝
- ISBN: 7115452407
- ISBN-13: 9787115452405
-
相關分類:
R 語言、Machine Learning
- 此書翻譯自: Machine Learning and Data Science: An Introduction to Statistical Learning Methods with R
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
SQL 語法範例辭典$550$468 -
Introduction to Algorithms, 3/e (IE-Paperback)$1,590$1,558 -
$330程序員修煉之道 :從小工到專家 (The Pragmatic Programmer: From Journeyman to Master) -
機器學習駭客秘笈 (Machine Learning for Hackers)$680$537 -
$414機器學習與R語言實戰 -
$354數據科學實戰手冊 R+Python (Practical Data Science Cookbook) -
Data Science from Scratch|用 Python 學資料科學 (中文版)(Data Science from Scratch: First Principles with Python)$580$458 -
$354預測分析:R語言實現 -
$374實用機器學習 (Practical Machine Learning) -
$327Python 機器學習實踐指南 (Python Machine Learning Blueprints) -
$474數據科學家養成手冊 -
$474TensorFlow技術解析與實戰 -
$528收穫,不止 SQL 優化 — 抓住 SQL 的本質 -
$510數據天才:數據科學家修煉之道 -
Effective SQL 中文版 | 寫出良好 SQL 的 61個具體做法 (Effective SQL : 61 Specific Ways to Write Better SQL)$450$356 -
R 語言資料分析:從機器學習、資料探勘、文字探勘到巨量資料分析, 2/e$520$406 -
TensorFlow + Keras 深度學習人工智慧實務應用$590$460 -
$403統計學習導論 -- 基於 R應用 -
寫程式前就該懂的演算法 ─ 資料分析與程式設計人員必學的邏輯思考術 (Grokking Algorithms: An illustrated guide for programmers and other curious people)$390$308 -
R語言:金融演算法與台指期貨程式交易實務$500$390 -
認識資料科學的第一本書 (Data Analytics Made Accessible)$450$356 -
R 資料科學 (R for Data Science)$780$616 -
實戰 R語言預測分析$520$411 -
$219統計學習理論基礎 -
C++ 程式設計與運算思維實務:輕鬆掌握物件導向設計技巧的16堂課$560$437
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
當前,機器學習和數據科學都是很重要和熱門的相關學科,需要深入地研究學習才能精通。
本書試圖指導讀者掌握如何完成涉及機器學習的數據科學項目。本書將為數據科學家提供一些在統計學習領域會用到的工具和技巧,涉及數據連接、數據處理、探索性數據分析、監督機器學習、非監督機器學習和模型評估。本書選用的是R統計環境,書中所有代碼示例都是用R語言編寫的,涉及眾多流行的R包和數據集。
本書適合數據科學家、數據分析師、軟件開發者以及需要瞭解數據科學和機器學習方法的科研人員閱讀參考。
目錄大綱
第1章機器學習綜述 1
1.1 機器學習的分類2
1.2 機器學習的實際案例3
1.2.1 預測回頭客挑戰賽4
1.2.2 Netflix公司5
1.2.3 算法交易挑戰賽6
1.2.4 Heritage健康獎7
1.3 機器學習的過程10
1.4 機器學習背後的數學15
1.5 成為一名數據科學家16
1.6 統計計算的R工程18
1.7 RStudio 19
1.8 使用R包20
1.9 數據集22
1.10 在生產中使用R 23
1.11 小結24
第2章連接數據25
2.1 管理你的工作目錄27
2.2 數據文件的種類28
2.3 數據的來源28
2.4 從網絡中下載數據集29
2.5 讀取CSV文件31
2.6 讀取Excel文件33
2.7 使用文件連接34
2.8 讀取JSON文件35
2.9 從網站中抓取數據36
2.10 SQL數據庫38
2.11 R中的SQL等價表述42
2.12 讀取Twitter數據46
2.13 從谷歌分析中讀取數據48
2.14 寫數據51
2.15 小結53
第3章數據處理54
3.1 特徵工程57
3.2 數據管道59
3.3 數據採樣60
3.4 修正變量名60
3.5 創建新變量62
3.6 數值離散化63
3.7 日期處理65
3.8 將類變量二值化67
3.9 合併數據集68
3.10 排列數據集70
3.11 重塑數據集71
3.12 使用dplyr進行數據操作72
3.13 處理缺失數據75
3.14 特徵縮放77
3.15 降維78
3.16 小結81
第4章探索性數據分析83
4.1 數據統計84
4.2 探索性可視化87
4.3 直方圖88
4.4 箱形圖89
4.5 條形圖92
4.6 密度圖93
4.7 散點圖95
4.8 QQ圖101
4.9 熱圖102
4.10 缺失值的圖表103
4.11 解釋性圖表104
4.12 小結106
第5章回歸107
5.1 一元線性回歸108
5.2 多元線性回歸120
5.3 多項式回歸127
5.4 小結134
第6章分類136
6.1 一個簡單的例子137
6.2 邏輯回歸139
6.3 分類樹143
6.4 樸素貝葉斯147
6.5 K-最近鄰151
6.6 支持向量機155
6.7 神經網絡159
6.8 集成165
6.9 隨機森林168
6.10 梯度提昇機171
6.11 小結174
第7章評估模型性能176
7.1 過擬合177
7.2 偏差和方差183
7.3 乾擾因子187
7.4 數據洩漏188
7.5 測定回歸性能190
7.6 測定分類性能194
7.7 交叉驗證197
7.8 其他機器學習診斷法204
7.8.1 獲取更多的訓練觀測數據205
7.8.2 特徵降維205
7.8.3 添加新特徵205
7.8.4 添加多項式特徵206
7.8.5 對正則化參數進行微調206
7.9 小結206
第8章非監督學習208
8.1 聚類209
8.2 模擬聚類211
8.3 分級聚類212
8.4 K-均值聚類219
8.5 主成分分析224
8.6 小結233
術語表234
