機器學習精講 (全彩印刷)(The Hundred-Page Machine Learning Book)

[加拿大] 安德烈·布可夫(Andriy Burkov)

  • 機器學習精講 (全彩印刷)(The Hundred-Page Machine Learning Book)-preview-1
  • 機器學習精講 (全彩印刷)(The Hundred-Page Machine Learning Book)-preview-2
機器學習精講 (全彩印刷)(The Hundred-Page Machine Learning Book)-preview-1

買這商品的人也買了...

商品描述

內容提要

本書用簡短的篇幅、精煉的語言,講授機器學習領域必備的知識和技能。全書共11章和一個術語表,依次介紹了機器學習的基本概念、符號和定義、算法、基本實踐方法、神經網絡和深度學習、問題與解決方案、進階操作、非監督學習以及其他學習方式等,涵蓋了監督學習和非監督學習、支持向量機、神經網絡、集成學習、梯度下降、聚類分析、維度降低、自編碼器、遷移學習、強化學習、特徵工程、超參數調試等眾多核心概念和方法。全書最後給出了一個較為詳盡的術語表。

本書能夠幫助讀者瞭解機器學習是如何工作的,為進一步理解該領域的復雜問題和進行深入研究打好基礎。本書適合想要學習和掌握機器學習的軟件從業人員、想要運用機器學習技術的數據科學家閱讀,也適合想要瞭解機器學習的一般讀者參考。

作者簡介

作者簡介
安德烈·布可夫(Andriy Burkov)是一位機器學習專家,目前居住於加拿大魁北克省。他擁有人工智能博士學位,尤其擅長自然語言處理技術。目前,他是高德納(Gartner)諮詢公司機器學習開發團隊的主管。該團隊的主要工作是,使用淺層和深度學習技術,開發可用於生產環境的、先進的多語言文字抽取和標準化系統。


譯者簡介
韓江雷,畢業於新加坡南洋理工大學計算機科學學院,目前擔任思愛普公司(新加坡)數據科學家,同時在南洋理工大學攻讀博士學位。他的研究方向包括文本分析、數據挖掘以及機器學習的垂直領域應用等。

目錄大綱

第1章緒論1
1.1什麼是機器學習1
1.2不同類型的學習1
1.2.1監督學習1
1.2.2非監督學習2
1.2.3半監督學習3
1.2.4強化學習3
1.3監督學習是如何工作的4
1.4為什麼模型可以應用於新數據9


第2章符號和定義10
2.1符號10
2.1.1數據結構10
2.1.2大寫西格瑪符號12
2.1.3大寫派符號12
2.1.4集合運算13
2.1.5向量運算13
2.1.6函數14
2.1.7 max和argmax16
2.1.8賦值運算符16
2.1.9導數和梯度16
2.2隨機變量18
2.3無偏估計值20
2.4貝葉斯準則21
2.5參數估計21
2.6參數與超參數23
2.7分類vs.回歸23
2.8基於模型學習vs.基於實例學習24
2.9淺層學習vs.深度學習24


第3章基本算法26
3.1線性回歸26
3.1.1問題陳述26
3.1.2解決方案28
3.2對數機率回歸30
3.2.1問題陳述31
3.2.2解決方案32
3.3決策樹學習34
3.3.1問題陳述34
3.3.2解決方案34
3.4支持向量機37
3.4.1處理噪聲38
3.4.2處理固有非線性39
3.5 k近鄰42


第4章算法剖析43
4.1一個算法的組成部分43
4.2梯度下降44
4.3機器學習工程師如何工作50
4.4學習算法的特性51


第5章基本實踐53
5.1特徵工程53
5.1.1獨熱編碼54
5.1.2裝箱55
5.1.3歸一化56
5.1.4標準化56
5.1.5處理特徵缺失值57
5.1.6數據補全技術58
5.2選擇學習算法59
5.3 3個數據集61
5.4欠擬合與過擬合63
5.5正則化66
5.6模型效果評估67
5.6.1混淆矩陣69
5.6.2查准率/查全率70
5.6.3準確率71
5.6.4代價敏感準確率71
5.6.5 ROC曲線下面積72
5.7超參數調試73
交叉驗證75


第6章神經網絡和深度學習77
6.1神經網絡77
6.1.1多層感知機例子78
6.1.2前饋神經網絡80
6.2深度學習81
6.2.1捲軸神經網絡83
6.2.2循環神經網絡90


第7章問題與解決方案96
7.1核回歸96
7.2多類別分類98
7.3單類別分類99
7.4多標籤分類102
7.5集成學習104
7.5.1提升法與裝袋法105
7.5.2隨機森林105
7.5.3梯度提升106
7.6學習標註序列109
7.7序列到序列學習111
7.8主動學習113
7.9半監督學習115
7.10單樣本學習118
7.11零樣本學習120


第8章進階操作122
8.1處理不平衡的數據集122
8.2組合模型124
8.3訓練神經網絡125
8.4進階正則化127
8.5處理多輸入128
8.6處理多輸出129
8.7遷移學習130
8.8算法效率131


第9章非監督學習135
9.1密度預估135
9.2聚類138
9.2.1 k均值138
9.2.2 DBSCAN和HDBSCAN140
9.2.3決定聚類簇個數141
9.2.4其他聚類算法145
9.3維度降低148
9.3.1主要成分分析149
9.3.2 UMAP151
9.4異常值檢測153


第10章其他學習形式154
10.1質量學習154
10.2排序學習156
10.3推薦學習159
10.3.1因子分解機161
10.3.2去噪自編碼器163
10.4自監督學習:詞嵌入164


第11章結論167
11.1主題類型167
11.2高斯過程168
11.3廣義線性模型168
11.4概率圖模型168
11.5馬爾可夫鏈蒙特卡洛算法169
11.6基因算法170
11.7強化學習170
術語表172