數據挖掘導論, 2/e (Introduction to Data Mining, 2/e)

［美］　陳封能（Pang-Ning Tan）邁克爾·斯坦巴赫（Michael Steinbach）阿努吉·長帕坦（Anuj Karpatne）維平·庫瑪爾（Vipin Kumar）　著

出版商: 機械工業
出版日期: 2019-08-01
售價: $834
貴賓價: 9.5 折 $792
語言: 簡體中文
頁數: 480
ISBN: 7111631625
ISBN-13: 9787111631620
相關分類: Text-mining、Data-mining
此書翻譯自: Introduction to Data Mining, 2/e (美國原版)

立即出貨 (庫存 < 4)

買這商品的人也買了...

~~$1,350~~ $1,323

Data Mining : Concepts and Techniques, 3/e (Hardcover)
$351

機器學習實戰
~~$580~~ $458

現代 PHP｜新的特點及良好習慣 (Modern PHP: New Features and Good Practices)
$300

Vim 實用技巧, 2/e (Practical Vim : Edit Text at the Speed of Thought, 2/e)
$504

圖像處理、分析與機器視覺, 4/e (Image Processing, Analysis, and Machine Vision, 4/e)
~~$390~~ $195

寫程式前就該懂的演算法 ─ 資料分析與程式設計人員必學的邏輯思考術 (Grokking Algorithms: An illustrated guide for programmers and other curious people)
$312

Web API 的設計與開發 (Web API : the Good Parts)
$351

高效機器學習：理論、算法及實踐
~~$400~~ $380

機器學習 -- 探索人工智慧關鍵
$504

神經網絡設計 (Neural Network Design, 2/e)
$570

密碼編碼學與網絡安全：原理與實踐, 7/e
~~$474~~ $450

程序員的數學2 : 概率統計
~~$474~~ $450

RISC-V 架構與嵌入式開發快速入門
~~$820~~ $779

企業研究方法, 13/e (Schindler: Business Research Methods, 13/e)
~~$700~~ $665

大數據分析與資料挖礦, 2/e
~~$1,420~~ $1,391

Introduction to Data Mining, 2/e (GE-Paperback)
$402

LLVM 編譯器實戰教程
~~$880~~ $862

數位影像處理 (Gonzalez & Woods : Digital Image Processing, 4/e)
~~$690~~ $545

SLAM 視覺十四講：雙倍內容強化版
~~$780~~ $616

Laravel 啟動與運行, 2/e (Laravel : Up & Running: A Framework for Building Modern PHP Apps, 2/e)
~~$780~~ $616

社群網站的資料探勘, 3/e (Mining the Social Web: Data Mining Facebook, Twitter, LinkedIn, Google+, GitHub, and More, 3/e)
~~$1,450~~ $1,421

Fundamentals of Machine Learning for Predictive Data Analytics : Algorithms, Worked Examples, and Case Studies, 2/e (Hardcover)
$706

模式分類（原書第2版·典藏版）
$356

Python 極客項目編程, 2/e
$657

數據挖掘：概念與技術 (原書第4版)

商品描述

本書從算法的角度介紹數據挖掘所使用的主要原理與技術。為了更好地理解數據挖掘技術如何用於各種類型的數據，研究這些原理與技術是至關重要的。
本書所涵蓋的主題包括：數據預處理、預測建模、關聯分析、聚類分析、異常檢測和避免錯誤發現。通過介紹每個主題的基本概念和算法，為讀者提供將數據挖掘應用於實際問題所需的必要背景以及方法。

本書特點
針對每個主題，從基本概念和算法的角度展開講解。其中，分類、關聯分析、聚類分析更是切割成介紹章和高級章：介紹章覆蓋基本概念、代表性算法和評估技術內容；高級章深入討論高級概念和算法。
避免錯誤發現主題更是數據挖掘相關教科書中少見的，該主題討論了關於避免虛假結果的統計概念，作為其他章節的補充，強調對數據分析結果的有效性和可重復性的關註。
基礎內容和高級內容漸進的巧妙安排，使讀者能透徹地理解數據挖掘的基礎，同時掌握更多重要的高級技巧。

作者簡介

陳封能（Pang-Ning Tan）密歇根州立大學計算機科學與工程系教授，主要研究方向是數據挖掘、數據庫系統、網絡空間安全、網絡分析等。

目錄大綱

出版者的話
譯者序
前言
第1章緒論
1.1 什麼是數據挖掘
1.2 數據挖掘要解決的問題
1.3 數據挖掘的起源
1.4 數據挖掘任務
1.5 本書組織結構
文獻註釋
參考文獻
習題
第2章數據
2.1 數據類型
2.1.1 屬性與度量
2.1.2 數據集的類型
2.2 數據質量
2.2.1 測量和數據收集問題
2.2.2 關於應用的問題
2.3 數據預處理
2.3.1 聚集
2.3.2 抽樣
2.3.3 維歸約
2.3.4 特征子集選擇
2.3.5 特征創建
2.3.6 離散化和二元化
2.3.7 變量變換
2.4 相似性和相異性的度量
2.4.1 基礎
2.4.2 簡單屬性之間的相似度和相異度
2.4.3 數據對象之間的相異度
2.4.4 數據對象之間的相似度
2.4.5 鄰近度度量的例子
2.4.6 互信息
*2.4.7 核函數
*2.4.8 Bregman散度
2.4.9 鄰近度計算問題
2.4.10 選擇正確的鄰近度度量
文獻註釋
參考文獻
習題
第3章分類：基本概念和技術
3.1 基本概念
3.2 一般的分類框架
3.3 決策樹分類器
3.3.1 構建決策樹的基本算法
3.3.2 表示屬性測試條件的方法
3.3.3 選擇屬性測試條件的方法
3.3.4 決策樹歸納算法
3.3.5 示例：Web機器人檢測
3.3.6 決策樹分類器的特征
3.4 模型的過擬合
3.5 模型選擇
3.5.1 驗證集應用
3.5.2 模型覆雜度合並
3.5.3 統計範圍估計
3.5.4 決策樹的模型選擇
3.6 模型評估
3.6.1 保持方法
3.6.2 交叉驗證
3.7 超參數的使用
3.7.1 超參數選擇
3.7.2 嵌套交叉驗證
3.8 模型選擇和評估中的陷阱
3.8.1 訓練集和測試集之間的重疊
3.8.2 使用驗證錯誤率作為泛化錯誤率
*3.9 模型比較
3.9.1 估計準確率的置信區間
3.9.2 比較兩個模型的性能
文獻註釋
參考文獻
習題
第4章分類：其他技術
第5章關聯分析：基本概念和算法
第6章關聯分析：高級概念
第7章聚類分析：基本概念和算法
第8章聚類分析：其他問題與算法
第9章異常檢測
第10章避免錯誤發現
索引