特徵工程的藝術：通用技巧與實用案例 The Art of Feature Engineering: Essentials for Machine Learning

Name: 特徵工程的藝術：通用技巧與實用案例
Price: 512 TWD
Availability: InStock
Author: [加拿大]巴勃羅·迪布（Pablo Duboue）
ISBN: 7115588414

[加拿大]巴勃羅·迪布（Pablo Duboue）

預覽內頁

出版商: 人民郵電
出版日期: 2022-05-01
售價: $539
貴賓價: 9.5 折 $512
語言: 簡體中文
頁數: 202
ISBN: 7115588414
ISBN-13: 9787115588418
相關分類: Data Science、Machine Learning
此書翻譯自: The Art of Feature Engineering: Essentials for Machine Learning

立即出貨

買這商品的人也買了...

$301

特徵工程入門與實踐 (Feature Engineering Made Easy)
$594

機器學習：算法視角（Machine Learning: An Algorithmic Perspective 2/e）
~~$520~~ $406

特徵工程不再難：資料科學新手也能輕鬆搞定！ (Feature Engineering Made Easy: Identify unique features from your dataset in order to build powerful machine learning systems)
~~$520~~ $411

機器學習｜特徵工程 (Feature Engineering for Machine Learning)
$207

算法設計指南, 2/e (The Algorithm Design Manual, 2/e)
~~$580~~ $452

機器學習的數學：用數學引領你走進 AI 的神秘世界
$454

Python 機器學習系統構建 (原書第3版)
~~$954~~ $906

統計學習要素：機器學習中的數據挖掘、推斷與預測, 2/e (The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2/e)
~~$1,000~~ $850

Kaggle 競賽攻頂秘笈 -- 揭開 Grandmaster 的特徵工程心法，掌握制勝的關鍵技術
~~$354~~ $336

圖像處理與圖像分析基礎 (C/C++語言版)
$393

Android 移動安全攻防實戰 (微課視頻版)
$509

深度學習原理與PyTorch實戰（第2版）
$556

計算機視覺應用與實戰
~~$650~~ $514

圖解機器學習與資料科學的數學基礎｜使用 Python
~~$500~~ $395

一邊解題一邊學｜Python 初學者的練習本
~~$880~~ $695

機器學習聖經：最完整的統計學習方法
~~$680~~ $537

Python 操作 Excel - 最強入門邁向辦公室自動化之路 - 王者歸來
~~$620~~ $490

AI 開發的機器學習系統設計模式
~~$720~~ $562

從零開始學 Python 程式設計, 3/e (適用Python 3.10以上)
~~$600~~ $468

Python：股票 × ETF 量化交易回測 102個活用技巧
~~$620~~ $490

從機器學習到人工智慧｜寫給 Android/iOS 程式師的 ML/AI 開發指南 (AI and Machine Learning for On-Device Development: A Programmer's Guide)
~~$600~~ $468

圖解資料結構 × 演算法：運用 Python
~~$888~~ $844

商業分析全攻略：用數據分析解決商業問題 (全彩)
~~$1,080~~ $853

Python - 最強入門邁向數據科學之路 - 王者歸來 (全彩印刷第三版)
~~$680~~ $537

Python 資料科學實戰教本 - 爬蟲、清理、資料庫、視覺化、探索式分析、機器學習建模，數據工程一次搞定！

初夏簡體電腦展2書75折詳見活動內容 »

79折
$284

一本書玩轉 DeepSeek
VIP 95折
~~$774~~ $735

數據治理概念方法與實踐
79折
$379

AI全能助手人人都能玩轉DeepSeek
$834

射頻微電子學 (原書第二版)
VIP 95折
~~$359~~ $341

解鎖 DeepSeek：開啟多元智能應用新時代
VIP 95折
~~$419~~ $398

AI虛擬模擬從入門到參賽
79折
$378

DeepSeek 極速上手 : 高效做事不內耗
85折
$250

DeepSeek 應用能手 : 7天從入門到精通
VIP 95折
~~$359~~ $341

Deepseek 實戰指南
VIP 95折
~~$659~~ $626

圖解算法和數據結構
VIP 95折
~~$599~~ $569

HCIA-Security 學習指南
VIP 95折
~~$359~~ $341

Photoshop 2024+AIGC圖形圖像處理（微課版）
VIP 95折
~~$324~~ $308

新媒體營銷（慕課版第2版）
VIP 95折
~~$299~~ $284

Android移動開發基礎教程（慕課版）（第2版）
VIP 95折
~~$419~~ $398

Stable Diffusion AIGC繪畫與視頻生成基礎教程（微課版）
85折
$305

DeepSeek公文寫作一本通
85折
$152

AI 導航式提問法 : 用好 DeepSeek 與元寶的高效提問手冊
85折
$403

DeepSeek全場景應用
85折
$454

24小時精通 AI Agent (快速定製你的智能體)
79折
$378

Joy RL：強化學習實踐教程
85折
$357

大模型應用開發極簡入門(基於DeepSeek雙色版)
VIP 95折
~~$774~~ $735

AI 處理器硬件架構設計
VIP 95折
~~$594~~ $564

大模型驅動的研發效能實踐
VIP 95折
~~$588~~ $559

Hadoop與Spark大數據全景解析（視頻教學版）
VIP 95折
~~$534~~ $507

Midjourney + Stable Diffusion AIGC 創意設計與插畫繪制實操

商品描述

特徵工程可以修改數據特徵，更好地捕獲問題本質，從而改進結果。這個過程既是一種藝術，也是技巧和訣竅的一種結合。本書是一本特徵工程實用指南，主要探討如何利用特徵工程提升機器學習解決方案的性能。本書從特徵工程的基本概念和技術開始介紹，建立了一種特殊的跨領域方法，通過充分研究案例詳細介紹了圖數據、時間戳數據、文本數據和圖像數據的處理方法，包括分箱、折外估計、特徵選擇、數據降維和可變長度數據編碼等重要主題。

作者簡介

巴勃羅·迪布（Pablo Duboue）

NLP學者。2005年博士畢業於美國哥倫比亞大學，師從ACL前主席Kathleen McKeown教授，曾是IBM Watson DeepQA團隊成員。2016年創辦NLP技術公司Textualization。他有豐富的教學經驗，是世界多所大學的訪問教授。

目錄大綱

第一部分基礎知識

第 1章簡介　　2

1.1 特徵工程　　4

1.2 模型評價　　8

1.2.1 度量　　8

1.2.2 交叉驗證　　10

1.2.3 過擬合　　11

1.2.4 維數災難　　12

1.3 周期　　12

1.3.1 ML周期　　13

1.3.2 特徵工程周期　　15

1.4 分析　　17

1.4.1 探索性數據分析　　17

1.4.2 誤差分析　　18

1.5 其他過程　　20

1.5.1 領域建模　　20

1.5.2 特徵構建　　22

1.6 討論　　24

1.7 擴展學習　　26

第 2章特徵組合：歸一化、離散化和異常值　　28

2.1 歸一化特徵　　29

2.1.1 標準化和去相關性　　31

2.1.2 平滑　　33

2.1.3 特徵加權　　34

2.2 離散化和分箱　　35

2.2.1 無監督離散化　　36

2.2.2 監督離散化　　38

2.3 描述性特徵　　41

2.3.1 直方圖　　41

2.3.2 其他描述性特徵　　43

2.4 處理異常值　　44

2.5 高級技術　　46

2.6 擴展學習　　47

第3章特徵擴展：可計算特徵、填充與核技巧　　48

3.1 可計算特徵　　49

3.2 填充　　54

3.3 復雜特徵分解　　57

3.4 核操作特徵擴展　　59

3.5 擴展學習　　62

第4章特徵縮減：特徵選擇、降維和嵌入　　64

4.1 特徵選擇　　65

4.1.1 度量　　66

4.1.2 組成特徵集：搜索與篩選　　73

4.1.3 高級技術　　75

4.2 正則化與嵌入式特徵選擇　　77

4.2.1 L2 正則化：嶺回歸　　78

4.2.2 L1 正則化：LASSO　　78

4.2.3 其他使用嵌入式特徵選擇的算法　　79

4.3 數據降維　　80

4.3.1 特徵哈希　　81

4.3.2 隨機投影　　82

4.3.3 奇異值分解　　82

4.3.4 隱狄利克雷分配　　83

4.3.5 聚類　　84

4.3.6 其他數據降維技術　　85

4.3.7 嵌入　　86

4.4 擴展學習　　90

第5章高級主題：可變長度數據與自動特徵工程　　91

5.1 可變長度特徵向量　　91

5.1.1 集合　　91

5.1.2 列表　　92

5.1.3 樹　　94

5.1.4 圖　　96

5.1.5 時間序列　　97

5.2 基於實例的特徵工程　　100

5.3 深度學習與特徵工程　　102

5.4 自動特徵工程　　105

5.4.1 特徵學習　　105

5.4.2 無監督特徵工程　　108

5.5 擴展學習　　109

第二部分案例研究

第6章圖數據　　113

6.0 本章概述　　115

6.1 WikiCities數據集　　116

6.2 探索性數據分析　　117

6.3 第一個特徵集　　124

6.4 第二個特徵集　　130

6.5 最終的特徵集　　131

6.6 擴展學習　　133

第7章時間戳數據　　134

7.0 本章概述　　135

7.1 WikiCities：歷史特徵　　137

7.2 時間延遲特徵　　139

7.2.1 填充時間戳數據　　139

7.2.2 第一次特徵化：填充二階延遲數據　　140

7.2.3 誤差分析　　141

7.3 滑動窗口　　142

7.4 第三次特徵化：EMA　　143

7.5 使用歷史數據進行擴展　　143

7.5.1 第四次特徵化：擴展的數據　　144

7.6 時間序列　　145

7.6.1 WikiCountries數據集　　145

7.6.2 探索性數據分析　　146

7.6.3 第一次特徵化：無TS特徵　　149

7.6.5 使用模型預測作為特徵　　149

7.6.6 討論　　150

7.7 擴展學習　　151

第8章文本數據　　153

8.0 本章概述　　155

8.1 WikiCities：文本　　156

8.2 探索性數據分析　　156

8.3 僅數值型記號　　159

8.3.1 詞類型與記號　　160

8.3.2 分詞：基礎知識　　160

8.3.3 第一次特徵化　　161

8.4 詞袋　　162

8.4.1 分詞　　162

8.4.2 第二次特徵化　　163

8.5 停用詞和形態學特徵　　165

8.5.1 停用詞　　165

8.5.2 分詞：詞乾提取　　166

8.5.3 第三次特徵化　　166

8.6 上下文特徵　　167

8.6.1 二元詞　　168

8.6.2 第四次特徵化　　169

8.7 跳躍二元詞與特徵哈希　　169

8.7.1 跳躍二元詞　　169

8.7.2 第五次特徵化　　169

8.8 數據降維與嵌入　　170

8.8.1 嵌入　　170

8.8.2 特徵加權：TF-IDF　　171

8.8.3 第六次特徵化　　172

8.9 結束語　　172

8.9.1 內容擴展　　174

8.9.2 文本中的結構　　174

8.10 擴展學習　　174

第9章圖像數據　　175

9.0 本章概述　　176

9.1 WikiCities：衛星圖像　　177

9.2 探索性數據分析　　178

9.3 像素即特徵　　179

9.3.1 第一次特徵化　　179

9.3.2 可計算特徵：高斯模糊　　180

9.3.3 白化　　182

9.3.4 對變動的誤差分析　　183

9.4 自動數據集擴展　　183

9.4.1 仿射變換　　184

9.4.2 第二次特徵化　　184

9.5 描述性特徵：直方圖　　184

9.6 局部特徵檢測器：角點　　185

9.6.1 Harris角點檢測　　186

9.6.2 第四次特徵化　　186

9.7 數據降維：HOG　　187

9.8 結束語　　189

9.9 擴展學習　　191

第 10章其他領域：視頻、GIS和偏好　　192

10.1 視頻　　193

10.1.1 數據：屏幕錄制　　194

10.1.2 關鍵幀檢測　　194

10.1.3 目標跟蹤：均值漂移　　195

10.1.4 擴展學習　　197

10.2 地理特徵　　197

10.3 偏好　　199

10.3.1 數據：Linux核心代碼提交　　200

10.3.2 填充偏好數據　　201

10.3.3 擴展學習　　202

特徵工程的藝術：通用技巧與實用案例 The Art of Feature Engineering: Essentials for Machine Learning

[加拿大]巴勃羅·迪布（Pablo Duboue）

買這商品的人也買了...

初夏簡體電腦展2書75折詳見活動內容 »

相關主題

商品描述

作者簡介

目錄大綱

類似商品

最後瀏覽商品 (3)

特徵工程的藝術：通用技巧與實用案例 The Art of Feature Engineering: Essentials for Machine Learning

[加拿大]巴勃羅·迪布（Pablo Duboue）

買這商品的人也買了...

初夏簡體電腦展2書75折 詳見活動內容 »

相關主題

商品描述

作者簡介

目錄大綱

類似商品

最後瀏覽商品 (3)

初夏簡體電腦展2書75折詳見活動內容 »