集成學習:基礎與算法

李楠

買這商品的人也買了...

相關主題

商品描述

集成學習方法是一類先進的機器學習方法,這類方法訓練多個學習器並將它們結合起來解決一個問題,
在實踐中獲得了巨大成功。
全書分為三部分。
部分主要介紹集成學習的背景知識;
第二部分主要介紹集成學習方法的核心知識,包括Boosting、Bagging、Random Forests等經典算法,
平均、投票和Stacking等模型和方法、相關理論分析工作,以及多樣性度量和增強方面的進展。
第三部分介紹集成學習方法的進階議題,包括集成修剪、聚類集成和集成學習方法在半監督學習、
主動學習、代價敏感學習、類別不平衡學習,以及提升可理解性方面的進展。
此外,本書還在每章中的“拓展閱讀”部分提供了相關的進階內容。
本書適合對集成學習方法感興趣的研究人員、學生和實踐者閱讀。

目錄大綱

章緒論
1.1基本概念
1.2常用學習算法
1.2.1線性判別分析
1.2.2決策樹
1.2.3神經網絡
1.2.4樸素貝葉斯
1.2.5 k-近鄰
1.2.6支持向量機和核方法
1.3評估和對比
1.4集成學習方法
1.5集成學習方法的應用
1.6拓展閱讀

第2章Boosting
2.1 Boosting過程
2.2 AdaBoost算法
2.3說明性舉例
2.4理論探討
2.4.1基本分析
2.4.2間隔解釋
2.4.3統計視角
2.5多分類問題
2.6容噪能力
2.7拓展閱讀

第3章Bagging
3.1兩種集成範式
3.2 Bagging算法
3.3說明性舉例
3.4理論探討
3.5隨機樹集成
3.5.1隨機森林
3.5.2隨機化譜
3.5.3隨機森林用於密度估計
3.5.4隨機森林用於異常檢測
3.6拓展閱讀

第4章結合方法
4.1結合帶來的益處
4.2均值法
4.2.1簡單平均法
4.2.2加權平均法
4.3投票法
4.3.1絕對多數投票法
4.3. 2相對多數投票法
4.3.3加權投票法
4.3.4軟投票法
4.3.5理論探討
4.4學習結合法
4.4.1 Stacking
4.4.2無限集成
4.5其他結合方法
4.5.1代數法
4.5.2行為知識空間法
4.5.3決策模板法
4.6相關方法
4.6.1糾錯輸出編碼法
4.6.2動態分類器選擇法
4.6.3混合專家模型
4.7拓展閱讀

第5章多樣性
5.1集成多樣性
5.2誤差分解
5.2.1誤差-分歧分解
5.2.2偏差-方差-協方差分解
5.3多樣性度量
5.3.1成對度量
5.3.2非成對度量
5.3.3小結和可視化
5.3.4多樣性度量的局限
5.4信息論多樣性
5.4.1信息論和集成
5.4.2交互信息多樣性
5.4.3多信息多樣性
5.4.4估計方法
5.5多樣性增強
5.6拓展閱讀

第6章集成修剪
6.1何謂集成修剪
6.2多比全好
6.3修剪方法分類
6.4基於排序的修剪
6.5基於聚類的修剪
6.6基於優化的修剪
6.6.1啟發式優化修剪
6.6.2數學規劃修剪
6.6.3概率修剪
6.7拓展閱讀

第7章聚類集成
7.1聚類
7.1.1聚類方法
7.1.2聚類評估
7.1.3為什麼要做聚類集成
7.2聚類集成方法分類
7.3基於相似度的方法
7.4基於圖的方法
7.5基於重標記的方法
7.6基於變換的方法
7.7拓展閱讀

第8章進階議題
8.1半監督學習
8.1.1未標記數據的效用
8.1.2半監督學習的集成學習方法
8.2主動學習
8.2.1人為介入的效用
8.2.2基於集成的主動學習
8.3代價敏感學習
8.3.1不均等代價下的學習
8.3 .2代價敏感學習的集成方法
8.4類別不平衡學習
8.4.1類別不平衡
8.4.2類別不平衡學習的性能評估
8.4.3類別不平衡學習的集成方法
8.5提升可解釋性
8.5.1集成約簡
8.5.2規則抽取
8.5.3可視化
8.6未來的研究方向
8.7拓展閱讀
參考文獻