寫給程式師的資料採擷實踐指南 (A Programmer's Guide to Data Mining The Ancient Art of the Numerati) 写给程序员的数据挖掘实践指南
[美] Ron Zacharski 紮哈爾斯基
- 出版商: 人民郵電
- 出版日期: 2015-11-01
- 定價: $354
- 售價: 8.5 折 $301
- 語言: 簡體中文
- 頁數: 309
- 裝訂: 平裝
- ISBN: 7115336350
- ISBN-13: 9787115336354
-
相關分類:
Data-mining
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
人月神話:軟體專案管理之道 (20 週年紀念版)(The Mythical Man-Month: Essays on Software Engineering, Anniversary Edition, 2/e)$480$379 -
$294Python 數據分析基礎教程-NumPy 學習指南, 2/e (NumPy Beginner's Guide, 2/e) -
$294機器學習系統設計 (Building Machine Learning Systems with Python) -
Foundations of Algorithms, 5/e (Paperback)$1,790$1,754 -
$354單元測試的藝術 - 以 C# 為範例『第二版』 -
精通 Python|運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)$780$616 -
黑帽 Python | 給駭客與滲透測試者的 Python 開發指南 (Black Hat Python: Python Programming for Hackers and Pentesters)$400$316 -
$414Python 資料分析與挖掘實戰 -
$232Python 資訊視覺化編程實戰 (Python Data Visualization Cookbook) -
Android 高效入門>>深度學習-使用 Android Studio 2 開發 Android 6.0 APP
$650$507 -
$294貝葉斯思維 : 統計建模的 Python 學習法 (Think Bayes : Bayesian Statistics in Python) -
機器學習 | 使用 Python 進行預測分析的基本技術$580$458 -
Data Science from Scratch|用 Python 學資料科學 (中文版)(Data Science from Scratch: First Principles with Python)$580$458 -
$177Python數據分析實戰 -
$474機器學習導論 (An Introduction to Machine Learning) -
今天不學機器學習,明天就被機器取代:從 Python 入手+演算法$590$502 -
$245深度學習:原理與應用實踐 -
深度學習快速入門 — 使用 TensorFlow (Getting started with TensorFlow)
$360$281 -
演算法技術手冊, 2/e (Algorithms in a Nutshell: A Practical Guide, 2/e)$580$458 -
TensorFlow + Keras 深度學習人工智慧實務應用$590$460 -
$414深入理解 JVM & G1 GC -
打造可維護軟體|編寫可維護程式碼的10項法則 (Java版) (Building Maintainable Software, Java Edition: Ten Guidelines for Future-Proof Code)$450$356 -
$280深度學習理論與實踐 -
$607深度學習、優化與識別 (Deep Learning,Optimization and Recognition) -
$352實用機器學習 (Real-world Machine Learning)
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
<內容簡介>
數據挖掘一般是指從大量的數據中通過演算法搜索隱藏於其中信息的過程。大多數數據挖掘的教材都專註於介紹理論基礎,因而往往難以理解和學習。
紮哈爾斯基編著的《寫給程序員的數據挖掘實踐指南》是寫給程序員的一本數據挖掘指南,可以幫助讀者動手實踐數據挖掘、應用集體智慧並構建推薦系統。全書共8章,介紹了數據挖掘的基本知識和理論、協同過濾、內容過濾及分類、演算法評估、樸素貝葉斯、非結構化文本分類以及聚類等內容。本書採用「在實踐中學習」的方式,用生動的圖示、大量的表格、簡明的公式、實用的Python代碼示例,闡釋數據挖掘的知識和技能。每章還給出了習題和練習,幫助讀者鞏固所學的知識。
本書適合對數據挖掘、數據分析和推薦系統感興趣的程序員及相關領域的從業者閱讀參考;同時,本書也可以作為一本輕鬆有趣的數據挖掘課程教學參考書。
<章節目錄>
第1章 數據挖掘簡介及本書使用方法
歡迎來到21世紀
並不只是對象
TB級挖掘是現實不是科幻
本書體例
第2章 協同過濾——愛你所愛
如何尋找相似用戶
曼哈頓距離
歐氏距離
N維下的思考
一般化
Pymon中數據表示方法及代碼
計算曼哈頓距離的代碼
用戶的評級差異
皮爾遜相關係數
在繼續之前稍微休息一下
最後一個公式——餘弦相似度
相似度的選擇
一些怪異的事情
k近鄰
Python的一個推薦類
一個新數據集
第3章 協同過濾——隱式評級及基於物品的過濾
隱式評級
調整後的餘弦相似度
Slope One演算法
Slope One演算法的粗略描述圖
基於Python的實現
加權Slope One:推薦模塊
MovieLens數據集
第4章 內容過濾及分類——基於物品屬性的過濾
一個簡單的例子
用Python實現
給出推薦的原因
一個取值範圍的問題
歸一化
改進的標準分數
歸一化vs.不歸一化
回到Pandora
體育項目的識別
Python編程
就是它了
汽車MPG數據
雜談
第5章 分類的進一步探討——演算法評估及kNN
訓練集和測試集
10折交叉驗證的例子
混淆矩陣
一個編程的例子
Kappa統計量
近鄰演算法的改進
一個新數據集及挑戰
更多數據、更好的演算法以及一輛破公共汽車
第6章 概率及樸素貝葉斯一樸素貝葉斯
微軟購物車
貝葉斯定理
為什麼需要貝葉斯定理
i1OO i500
用Python編程實現
共和黨vs.民主黨
數字
Python實現
這種做法會比近鄰演算法好嗎
第7章 樸素貝葉斯及文本——非結構化文本分類
一個文本正負傾向性的自動判定系統
訓練階段
第8章 聚類——群組發現
k—means聚類
SSE或散度
小結
安然公司
