模式識別:數據質量視角 Pattern Recognition: A Quality of Data Perspective

Wladyslaw Homenda 張軼譯譯

買這商品的人也買了...

商品描述

幾十年來,實際需求激發了對模式識別的大量理論和應用研究。
在這個過程中,限制因素和恆久問題一直是數據——它的多樣性、
豐富性和可變質量是模式識別創新的主要挑戰。
本書關注高級數據分析和數據挖掘,
創新之處是對數據質量的重新定位——將數據質量看作一個可以處理的因素,而非當作需要克服的困難。

作者簡介

Władysław Homenda

 

波蘭華沙理工大學數學與信息科學學院教授,主要研究興趣包括知識表示與處理、智能計算、模糊建模、粒度計算和數據挖掘等。

 

 

Witold Pedrycz

 

波蘭科學院系統研究所教授,兼任加拿大阿爾伯塔大學電子與計算機工程系教授。

IEEE會士,加拿大皇家學會會士。主要研究興趣包括智能計算、信息處理、人工智能等。


---譯者簡介---
張軼

四川大學計算機學院副教授,研究方向為模式識別、視覺計算和機器智能,擔任“模式識別”課程的主講教師。

目錄大綱

譯者序
前言
第一部分基礎知識
第1章模式識別:特徵空間的構建2
1.1概念2
1.2從樣本到特徵5
1.2.1向量型特徵7
1.2.2特徵變換:從向量型到向量型8
1.2. 3特徵變換:從向量型到數值型9
1.2.4數值型特徵10
1.3特徵尺度化12
1.3.1特徵歸一化13
1.3.2標準化14
1.3.3特徵尺度的經驗評價15
1.4特徵評估和選擇18
1.4.1相關性18
1.4.2特徵評估:兩種方法20
1.4.3基於指數的特徵評估:單特徵與特徵集21
1.4.4特徵評估指數21
1.4.5基於指數的方法和基於包裝的方法23
1.4.6使用指數和分類器的單特徵評估方案24
1.4.7特徵子集的選擇27
1.4.8特徵子集的生成29
1.5結論37
附錄1.A38
附錄1.B40
參考文獻40

第2章模式識別:分類器42
2.1概念42
2.2最近鄰分類方法43
2.3支持向量機分類算法45
2.3.1線性可分類的線性劃分46
2.3.2線性不可分類的線性劃分48
2.3.3線性不可分類的非線性劃分50
2.4分類問題中的決策樹52
2.4.1決策樹一覽52
2.4.2特徵分解57
2.4.3度量類的差異性57
2.4.4選擇一個分解特徵60
2.4.5限制樹的結構61
2.5集成分類器62
2.5.1袋裝63
2.5.2提升64
2.5.3隨機森林65
2.6貝葉斯分類器67
2.6.1應用貝葉斯理論67
2.6.2最小化錯分概率68
2.6.3最小化損失69
2.6.4拒絕不確定樣本70
2.6.5類條件概率分佈71
2.7結論79
參考文獻79

第3章分類拒絕問題規範及概述82
3.1概念82
3.2拒絕架構的概念87
3.3基於原始樣本的拒絕91
3.3.1構建拒絕機制91
3.3.2全局拒絕架構下的拒絕機制92
3.3.3局部拒絕架構下的拒絕機制95
3.3.4嵌入式拒絕架構下的拒絕機制96
3.4原始樣本數據集中的拒絕選項:案例研究97
3.4.1數據集97
3.4.2構建一個樹形二值分類器100
3.4.3針對手寫數字數據集構建一個樹形二值分類器101
3.4.4針對手寫數字數據集構建一個帶拒絕的樹形二值分類器103
3.4.5拒絕被錯分的原始樣本:一些想法105
3.5結論106
參考文獻106

第4章評估模式識別問題108
4.1評估帶拒絕項的識別:基本概念108
4.1.1評估拒絕的效率108
4.1. 2不平衡原始集與異類集109
4.1.3度量拒絕質量的有效性110
4.1.4分離原始樣本和異類樣本111
4.1.5對多類原始樣本的適應112
4.1.6評估帶拒絕項的多類分類問題113
4.1.7說明性示例114
4.2沒有異類樣本時帶拒絕的分類問題117
4.3帶拒絕的分類:局部特徵120
4.3.1多類問題的特性描述120
4.3.2說明性示例 122
4.4結論125
參考文獻126

第5章帶拒絕的識別:經驗分析127
5.1實驗結果127
5.1.1拒絕架構的對比128
5.1.2減少特徵集數量131
5.1.3分類器質量與拒絕性能133
5.1.4用於處理不平衡數據集的帶拒絕的分類137
5.2幾何方法140
5.2.1超矩形141
5.2.2橢球體142
5.2.3在幾何模型中限制為原始樣本保留的區域143
5.2.4文獻評論153
5.3結論155
參考文獻155

第二部分高級主題:粒度計算框架
第6章信息粒的概念158
6.1信息粒度和粒度計算158
6.2信息粒度的正式平台161
6.3區間和區間微積分164
6.4模糊集微積分166
6.4.1模糊集的隸屬函數和類167
6.4.2三角範數和三角餘模作為模糊集上運算的模型170
6.5信息粒的特徵:覆蓋率和特異性173
6.6信息粒匹配176
6.7結論177
參考文獻177

第7章信息粒:基本構造179
7.1合理粒度原則179
7.1.1一般觀察182
7.1.2加權數據182
7.1.3抑制性數據183
7.2對設計有價值的信息粒度184
7.2.1粒映射184
7.2. 2信息粒度分配協議187
7.2.3粒度聚合:通過分配信息粒度增強聚合操作187
7.3時間序列模型中暫存數據的單步和多步預測188
7.4高級類型的粒模型的開發189
7.5粒樣本的分類192
7.5.1分類問題的公式化193
7.5.2從數值數據到粒數據193
7.5.3粒分類器:增強問題195
7.6結論195
參考文獻196

第8章聚類197
8.1模糊c均值聚類方法197
8.2 k均值聚類算法201
8.3帶有聚類和變量加權的增強模糊聚類201
8.4基於知識的聚類202
8.5聚類結果的質量202
8.6信息粒與聚類結果解釋204
8.6.1數字原型的粒度描述符的形成204
8.6.2數據粒度及其在FCM算法中的融合205
8.7層次聚類205
8.8隱私問題中的信息粒:微聚集的概念208
8.9更高類型信息粒的開發208
8.10實驗研究209
8.11結論217
參考文獻218

第9章數據質量:填補和數據平衡219
9.1數據填補:基本概