數據挖掘原理與算法(第4版)

毛國君、段立娟、賀文武

  • 出版商: 清華大學
  • 出版日期: 2023-08-01
  • 定價: $419
  • 售價: 8.5$356
  • 語言: 簡體中文
  • ISBN: 730262920X
  • ISBN-13: 9787302629207
  • 下單後立即進貨 (約4週~6週)

  • 數據挖掘原理與算法(第4版)-preview-1
  • 數據挖掘原理與算法(第4版)-preview-2
  • 數據挖掘原理與算法(第4版)-preview-3
數據挖掘原理與算法(第4版)-preview-1

商品描述

本書是一本全面介紹數據挖掘基本原理、核心算法以及典型應用方法的專業書籍。第4版在前三版的基礎上,對數據挖掘的方法論和知識點進行了重新歸納,按照基礎篇、提高篇和應用篇進行設計。從方法論上說,數據挖掘是一個方法和原理逐步演變的過程。首先,最基礎的數據挖掘方法主要有“關聯規則”“分類”“聚類”,它們是數據挖掘的靈魂和基礎,因此基礎篇是瞭解和學習數據挖掘技術的入門知識。其次,隨著數據挖掘技術研究和應用的深入,序列數據挖掘和深度神經網絡得到充分研究。前者突破數據庫的數據約束,面向時間序列發現有價值的知識模式; 後者突破淺層神經網絡的性能瓶頸,為多模態數據的自主挖掘提供新的解決途徑。因此,“序列模式”和“深度神經網絡”構成提高篇。最後,以互聯網數據挖掘、空間數據挖掘構成應用篇。全書分為3篇共9章,各章相對獨立,以利於讀者選擇性學習。在每章後面都專設一節對本章內容和文獻引用情況進行歸納,以利於讀者瞭解本章內容的知識點和檢索原始參考資料。 本書可作為電腦專業研究生或高年級本科生教材,也可作為從事電腦研究和開發人員的參考資料。作為教材,教師可以根據課時安排進行選擇性教學。對於研究和開發人員,本書不僅是一本具有較高參考價值的專業書籍,而且也是學習典型算法及其原理的很好的教科書。

目錄大綱

CONTENTS

目錄

基礎篇

第1章緒論

1.1數據挖掘技術的產生與發展

1.1.1數據挖掘技術的商業需求分析

1.1.2數據挖掘產生的技術背景分析

1.1.3大數據時代的數據挖掘技術需求分析

1.2數據挖掘研究的發展趨勢

1.3數據挖掘概念

1.3.1從商業角度看數據挖掘技術

1.3.2數據挖掘的技術含義

1.3.3數據挖掘研究的理論基礎

1.4數據挖掘技術的分類問題

1.5數據挖掘常用的知識表示模式與方法

1.5.1廣義知識挖掘

1.5.2關聯知識挖掘

1.5.3類知識挖掘

1.5.4預測型知識挖掘

1.5.5特異型知識挖掘

1.6不同數據存儲形式下的數據挖掘問題

1.6.1事務數據庫中的數據挖掘

1.6.2關系型數據庫中的數據挖掘

1.6.3數據倉庫中的數據挖掘

1.6.4在關系模型基礎上發展的新型數據庫中的數據

挖掘

1.6.5面向應用的新型數據源中的數據挖掘

1.6.6Web數據源中的數據挖掘

1.7粗糙集方法及其在數據挖掘中的應用

1.7.1粗糙集的一些重要概念

1.7.2粗糙集應用舉例

1.7.3粗糙集方法在KDD中的應用範圍

1.8數據挖掘的應用分析

1.8.1數據挖掘與CRM

1.8.2數據挖掘與社會網絡

1.8.3數據挖掘應用的成功案例分析

1.9本章小結和文獻註釋

習題1

第2章知識發現過程與應用結構

2.1知識發現的基本過程

2.1.1數據抽取與集成技術要點

2.1.2數據清洗與預處理技術要點

2.1.3數據的選擇與整理技術要點

2.1.4數據挖掘技術要點

2.1.5模式評估技術要點

2.2數據庫中的知識發現處理過程模型

2.2.1階梯處理過程模型

2.2.2螺旋處理過程模型

2.2.3以用戶為中心的處理模型

2.2.4聯機KDD模型

2.2.5支持多數據源多知識模式的KDD處理模型

2.3知識發現軟件或工具的發展

2.3.1獨立的知識發現軟件

2.3.2橫向的知識發現工具集

2.3.3縱向的知識發現解決方案

2.3.4KDD系統介紹

2.4知識發現項目的過程化管理

2.5數據挖掘語言介紹

2.5.1數據挖掘語言的分類

2.5.2數據挖掘查詢語言

2.5.3數據挖掘建模語言

2.5.4通用數據挖掘語言

2.5.5DMQL挖掘查詢語言介紹

2.6本章小結和文獻註釋

習題2

第3章關聯規則挖掘理論和算法

3.1基本概念與解決方法

3.2經典的頻繁項目集生成算法分析

3.2.1項目集空間理論

3.2.2經典的發現頻繁項目集算法

3.2.3關聯規則生成算法

3.3Apriori算法的性能瓶頸問題

3.4Apriori的改進算法

3.4.1基於數據分割的方法

3.4.2基於散列的方法

3.4.3基於採樣的方法

3.5項目集空間理論的發展

3.5.1Close算法

3.5.2FPtree算法

3.6項目集格空間和它的操作

3.7基於項目集操作的關聯規則挖掘算法

3.7.1關聯規則挖掘空間

3.7.2三個實用算子

3.7.3最大頻繁項目集格的生成算法

3.7.4ISSDM算法執行示例

3.8改善關聯規則挖掘質量問題

3.8.1用戶主觀層面

3.8.2系統客觀層面

3.9約束數據挖掘問題

3.9.1約束在數據挖掘中的作用

3.9.2約束的類型

3.10時態約束關聯規則挖掘

3.11關聯規則挖掘中的一些更深入的問題

3.11.1多層次關聯規則挖掘

3.11.2多維關聯規則挖掘

3.11.3數量關聯規則挖掘

3.12數量關聯規則挖掘方法

3.12.1數量關聯規則挖掘問題

3.12.2數量關聯規則的分類

3.12.3數量關聯規則挖掘的一般步驟

3.12.4數值屬性離散化問題及算法

3.13本章小結和文獻註釋

習題3

第4章分類方法

4.1分類的基本概念與步驟

4.2基於距離的分類算法

4.3決策樹分類方法

4.3.1決策樹基本算法概述

4.3.2ID3算法

4.3.3C4.5算法

4.4貝葉斯分類

4.4.1貝葉斯定理

4.4.2樸素貝葉斯分類

4.4.3EM算法

4.5規則歸納

4.5.1AQ算法

4.5.2CN2算法

4.5.3FOIL算法

4.6與分類有關的其他問題

4.6.1分類數據預處理

4.6.2分類器性能的表示與評估

4.7本章小結和文獻註釋

習題4

第5章聚類方法

5.1概述

5.1.1聚類分析在數據挖掘中的應用

5.1.2聚類分析算法的概念與基本分類

5.1.3距離與相似性的度量

5.2劃分聚類方法

5.2.1k平均算法

5.2.2PAM

5.2.3CLARANS算法

5.3層次聚類方法

5.3.1AGNES算法

5.3.2DIANA算法 

5.3.3其他層次聚類方法

5.4密度聚類方法

5.5其他聚類方法

5.5.1STING算法

5.5.2SOM算法

5.5.3COBWEB算法

5.5.4模糊聚類算法FCM

5.6本章小結和文獻註釋

習題5

提高篇

第6章時間序列和序列模式挖掘

6.1時間序列及其應用

6.2傳統的時間序列分析方法

6.3隨機時間序列分析方法

6.3.1時間序列的平穩性

6.3.2平穩的隨機時間序列分析模型

6.3.3非平穩的隨機時間序列分析模型

6.3.4時間序列中相似性及其序列匹配方法

6.4基於離散傅里葉變換的時間序列相似性查找

6.4.1完全匹配

6.4.2子序列匹配

6.5基於規範變換的查找方法

6.5.1基本概念

6.5.2查找方法

6.6序列挖掘

6.6.1基本概念

6.6.2數據源的形式

6.6.3序列模式挖掘的一般步驟

6.7AprioriAll算法

6.8AprioriSome算法

6.9GSP算法

6.10本章小結和文獻註釋

習題6

第7章神經網絡與深度學習

7.1線性網絡

7.1.1線性回歸模型

7.1.2隨機梯度下降

7.1.3神經網絡

7.1.4softmax回歸

7.1.5線性回歸模型實踐

7.1.6softmax回歸模型實踐

7.2多層感知器

7.2.1隱含層

7.2.2激活函數

7.2.3前向傳播與反向傳播

7.2.4暫退法

7.2.5多層感知器模型實踐

7.3捲積神經網絡

7.3.1捲積

7.3.2池化

7.3.3經典捲積神經網絡LeNet

7.3.4LeNet實踐

7.4深度捲積神經網絡

7.4.1現代捲積神經網絡AlexNet

7.4.2AlexNet實踐

7.4.3含並行連接的捲積神經網絡GoogleNet

7.4.4GoogleNet實踐

7.4.5殘差網絡ResNet

7.4.6ResNet18實踐

7.5PyTorch簡介

7.5.1PyTorch安裝

7.5.2Jupyter Notebook中PyTorch的初步實踐

7.5.3自動微分

7.5.4數據集讀寫及相關自定義函數

7.6本章小結和文獻註釋

習題7

應用篇

第8章Web挖掘技術

8.1Web挖掘的意義

8.2Web挖掘的分類

8.3Web挖掘的含義

8.3.1Web挖掘與信息檢索

8.3.2Web挖掘與信息抽取

8.4Web挖掘的數據來源

8.4.1服務器日誌數據

8.4.2在線市場數據

8.4.3Web頁面

8.4.4Web頁面之間的超鏈接關系

8.4.5其他信息

8.5Web內容挖掘方法

8.5.1爬蟲與Web內容挖掘

8.5.2虛擬的Web視圖

8.5.3個性化與Web內容挖掘

8.5.4對Web頁面內文本信息的挖掘

8.5.5對Web頁面內多媒體信息挖掘

8.5.6Web頁面內容的預處理

8.6Web訪問信息挖掘方法

8.6.1Web訪問信息挖掘的特點

8.6.2Web訪問信息挖掘的意義

8.6.3Web訪問信息挖掘的數據源

8.6.4Web訪問信息挖掘的一般過程

8.6.5Web訪問信息挖掘的數據清理

8.6.6用戶識別方法

8.6.7會話識別方法

8.6.8其他預處理技術

8.6.9Web訪問挖掘的應用方法

8.6.10Web訪問信息挖掘的要素構成

8.6.11Web訪問信息挖掘應用

8.7Web結構挖掘方法

8.7.1頁面等級(分級)的評價方法

8.7.2PageRank算法

8.7.3權威頁面和中心頁面

8.7.4Web站點結構的預處理

8.8本章小結和文獻註釋

習題8

第9章空間挖掘

9.1空間挖掘的意義

9.2空間數據概要

9.2.1空間數據的復雜性特徵

9.2.2空間數據的查詢問題

9.3空間數據組織

9.3.1最小包圍矩形

9.3.2空間索引技術

9.3.3專題地圖

9.4空間數據挖掘基礎

9.4.1空間數據的基本操作

9.4.2空間實體間的距離度量

9.4.3空間數據挖掘的基本方法

9.5空間關聯規則及其挖掘方法

9.5.1空間關聯規則概述

9.5.2空間關聯規則挖掘方法

9.6空間分類算法

9.6.1ID3在空間的擴展

9.6.2空間決策樹的構建方法

9.7空間聚類算法

9.7.1空間近似聚類的CRH方法

9.7.2基於隨機搜索的CLARANS擴展聚類方法

9.7.3大型空間數據庫基於距離分佈的聚類算法DBCLASD

9.7.4其他的空間聚類方法

9.8空間統計挖掘

9.9空間的概念泛化與特化

9.9.1逐步求精

9.9.2泛化

9.9.3統計學信息網格方法

9.10空間挖掘的其他問題

9.11空間數據挖掘原型系統介紹

9.12空間數據挖掘的研究現狀

9.13空間數據挖掘的研究與發展方向

9.14空間數據挖掘與相關學科的關系

9.14.1空間數據挖掘與空間數據庫

9.14.2空間數據挖掘與空間數據倉庫

9.14.3空間數據挖掘與空間聯機分析處理

9.14.4空間數據挖掘與地理信息系統

9.15數字地球

9.16本章小結和文獻註釋

習題9

參考文獻