數據挖掘算法 — 基於 C++ 及 CUDA C Modern Data Mining Algorithms in C++ and Cuda C: Recent Developments in Feature Extraction and Selection Algorithms for Data Science

Timothy Masters 周書鋒//連曉峰

買這商品的人也買了...

商品描述

本書是美國有名數據挖掘算法專家、
數值計算專業的數理統計學博士Timothy Masters的新作品。
作為一名嚴謹的數據挖掘工程師,應用中的預測或分類使你經常會面對成千上萬的候選特徵。
這些特徵絕大多數沒有價值或只有很小的價值,只有與某個或某些其他特徵聯合起來才可能有用;
一些特徵可能有巨大的預測能力,但它們又可能僅存在於整體特徵空間的某些區域……
數據挖掘中,類似這種使人痛苦的問題是無窮的。
本書中的現代特徵選擇技術,將幫助你解決這些問題。
本書中所有的算法都可被直覺證實,並有相關方程和解釋材料支撐。
作者還展現了這些算法的完整的、受到高度好評的源代碼,並對其進行了解析。
本書適合算法、數據挖掘、人工智能等專業領域的教師、
學生及相關的技術及研究人員作為參考及學習用書。

作者簡介

Timothy Masters

獲得數值計算專業的數理統計博士學位後,一直擔任政府和行業的獨立顧問。
早期研究領域包括高程影像的自動特徵檢測,
還開發了洪災和旱災預測,隱蔽導彈發射井檢測和軍用車輛識別等應用。
後來與醫學研究人員合作開發了穿刺活檢良性細胞/惡性細胞的計算鑑別算法。
在過去的20年中,主要專注於金融市場交易系統的自動評估方法研究。
撰寫了12本關於預測建模實際應用方面的圖書: 
《實用神經網絡C++實現》(Academic,1993) 《基於神經網絡的信號和圖像處理》(Wiley,1994.) 
《神經網絡先進算法》(Wiley,1995) 《時間序列預測的神經網絡、新型和混合算法》(Wiley,1995) 
《預測和分類的評估與改進》(Apress,2018) 《深度信念網絡的C++和CUDA C實現:
第一卷:受限玻爾茲曼機和監督式前饋網絡》(Apress,2018) 《深度信念網絡的C++和CUDA C實現:
第二卷:复域中的自編碼》(Apress,2018) 《深度信念網絡的C++和CUDAC實現:
第三卷:卷積神經網絡》(Apress,2018) 《數據挖掘算法的C++實現》(Apress,2018)
 《市場交易系統的測試與優化》(Apress,2018)
 《金融市場預測的可靠統計指標:C++算法實現》(KDP,2019,第2版2020) 
《交易系統開發的排列檢驗和隨機檢驗:C++算法實現》(KDP,2020)

目錄大綱

第1章  概述 1

第2章  前向選擇成分分析 3
前向選擇成分分析概述 3
數學原理與代碼示例 5
化解釋方差 6
方差化準則代碼 7
後向細化 10
多線程後向細化 13
有序成分正交化 18
綜合應用 20
僅前向選擇子集的成分變量 24
後向細化子集的成分變量 25
人工變量示例 26

第3章  局部特徵選擇 30
算法概述 30
算法輸出結果 34
簡要介紹:單純形算法 34
線性規劃問題 35
Simplex類的接口 36
更多細節 37
一種更嚴格的LFS方法 38
類內分割和類間分割 41
計算權重 43
化類間分割 45
小化類內分割 48
測試β試驗值 49
關於線程的簡要說明 52
CUDA權重計算 52
將CUDA代碼集成到算法中 53
初始化CUDA硬件 54
計算與當前實例之差 56
計算距離矩陣 57
計算小距離 59
計算權重方程項 63
轉置項矩陣 64
權重項求和 65
權重遷移到主機 66
局部特徵選擇示例 66
關於運行時的解釋說明 67

第4章  時間序列特徵的記憶特性 68
簡單數學概述 69
前向算法 70
後向算法 72
α和β修正 74
一些常規計算 78
均值和協方差 78
概率密度 79
多元正態概率密度函數 80
啟動參數 81
初始化算法流程 81
對均值施加擾動 82
對協方差施加擾動 82
對轉移概率施加擾動 83
關於隨機數發生器的解釋 83
完整優化算法 84
計算狀態概率 85
更新均值和協方差 87
更新初始概率和轉移概率 89
HMM在時間序列中的記憶特性評估 93
鏈接特徵變量與目標變量 96
鏈接HMM狀態與目標 102
一個人為的不當示例 109
一個合理可行的示例 111

第5章  逐步選擇改進算法 113
特徵評估模型 114
基本模型實現代碼 115
交叉驗證性能度量 118
逐步選擇算法 120
確定個變量 125
在現有模型中添加變量 127
三個算法演示示例 130

第6章  名義變量到有序變量的轉換 133
實現概述 135
合理關係測試 135
股票價格變動示例 136
名義變量到有序變量變換實現代碼 138
構造函數 139
輸出計數表 141
計算映射函數 143
Monte-Carlo置換檢驗 145