數據清洗 (微課視頻版)
黃源,何婕
- 出版商: 清華大學
- 出版日期: 2021-08-01
- 定價: $299
- 售價: 7.9 折 $236
- 語言: 簡體中文
- 頁數: 284
- 裝訂: 平裝
- ISBN: 7302577471
- ISBN-13: 9787302577478
-
相關分類:
Data-mining
立即出貨
買這商品的人也買了...
-
$1,728Microsoft SQL Server 2019: A Beginner's Guide, Seventh Edition -
$348數據清洗 -
點子總是來自不相干的地方 博報堂創意總監的27個找靈感技巧$300$255 -
$270概率論與數理統計 — 基於 Excel -
$454Python 科學計算及實踐 -
ETL 數據整合與處理 (Kettle)$299$284 -
$479讓工作化繁為簡: 用 Python 實現辦公自動化 -
$454SaaS 商業實戰:好模式如何變成好生意 -
$305機器學習入門與實戰 — 基於 scikit-learn 和 Keras -
$403Kettle 構建 Hadoop ETL 系統實踐 -
$559模式識別, 4/e (修訂版)(Pattern Recognition, 4/e) -
最優化導論, 4/e (An Introduction to Optimization, 4/e)$534$507 -
$254Python 深度學習實戰 — 基於 Pytorch -
$236統計學習必學的十個問題 — 理論與實踐 -
$236深度學習必學的十個問題 — 理論與實踐 -
$327Python 數據挖掘技術及應用 (微課版) -
$280計算方法 — 數據分析與智能計算初探, 2/e -
$621深度強化學習落地指南 -
$426Python 數據科學實戰 (Data Science with Python) -
$765Python 常用統計算法 -
$305大數據存儲 — 從 SQL 到 NoSQL -
$305深度強化學習 -
超圖解伺服器的架構與運用:硬體架構x軟體運用,輕鬆理解數位時代的必備知識$400$316 -
$331集成學習入門與實戰:原理、算法與應用 -
從異世界歸來發現只剩自己不會 Kubernetes:初心者進入雲端世界的實戰攻略!(iThome鐵人賽系列書)【平裝】$650$507
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書的編寫目的是向讀者介紹數據清洗技術的基本概念與應用。全書共10章,分別為數據清洗概述、文件格式、Web數據抽取、網絡爬蟲、Kettle數據清洗、數據遷移、文本數據處理、Python數據清洗、DataCleaner數據分析與清洗以及數據清洗綜合實訓。本書將理論與實踐操作相結合,通過大量的案例幫助讀者快速瞭解和應用數據清洗相關技術,並對書中重要的、核心的知識點加大練習力度,以達到熟練應用的目的。 本書可作為高等學校大數據、人工智能、雲計算等專業的教材,可也作為大數據愛好者的參考書。
作者簡介
黃源,男,計算機專業研究生,研究方向為計算機軟件與理論,2003年至今在重慶航天職業技術學院計算機系擔任專職教師,副教授,主要教授計算機網絡、計算機軟件等專業的專業課程。
目錄大綱
第1章數據清洗概述
1.1數據清洗基礎
1.1.1數據清洗的定義
1.1.2數據清洗的原理
1.1.3數據清洗的流程
1.1.4數據清洗的常用方法
1.1.5數據清洗的評估描述
1.1.6數據清洗中的常用評測數據集
1.2數據質量與數據倉庫
1.2.1數據質量的定義
1.2.2常見的數據質量問題
1.2.3數據質量與數據清洗
1.2.4數據倉庫與ETL
1.2.5數據映射
1.2.6主數據與元數據
1.3數據清洗中的統計基礎
1.3.1描述性統計
1.3.2推論統計
1.3.3隨機變量
1.4數據清洗環境與常用工具
1.4.1數據清洗環境介紹
1.4.2數據清洗常用工具
1.5本章小結
1.6實訓
習題1
第2章文件格式
2.1文件格式概述
2.2Kettle中文件格式的轉換
2.2.1文本文件轉換
2.2.2CSV文件轉換
2.2.3XML文件轉換
2.2.4JSON文件轉換
2.2.5Excel文件轉換
2.2.6生成記錄轉換
2.3本章小結
2.4實訓
習題2
第3章Web數據抽取
3.1Web數據抽取基礎
3.2Web數據抽取的實現
3.2.1Kettle數據抽取原理
3.2.2Kettle數據抽取實現
3.3本章小結
3.4實訓
習題3
第4章網絡爬蟲
4.1網絡爬蟲基礎
4.2Python3網絡爬蟲實現
4.2.1urllib模塊
4.2.2Requests庫
4.2.3BeautifulSoup庫
4.3Python3網絡爬蟲實例
4.3.1urllib實例
4.3.2requests實例
4.4本章小結
4.5實訓
習題4
第5章Kettle數據清洗
5.1Kettle數據清洗概述
5.2Kettle數據清洗實現
5.2.1清洗簡單數據
5.2.2清洗複雜數據
5.3本章小結
5.4實訓
習題5
第6章數據遷移
6.1數據遷移概述
6.2數據遷移實現技術
6.2.1基於主機的遷移方式
6.2.2備份恢復的遷移方式
6.2.3基於存儲的遷移方式
6.2.4基於文件系統的遷移方式
6.2.5基於數據庫的遷移方式
6.3數據遷移實現
6.3.1數據庫安裝與使用
6.3.2Kettle數據遷移
6.4本章小結
6.5實訓
習題6
第7章文本數據處理
7.1文本分詞
7.2文本數據處理方法
7.3jieba分詞的應用
7.3.1jieba概述
7.3.2jieba應用實例
7.4本章小結
7.5實訓
習題7
第8章Python數據清洗
8.1Python數據清洗概述
8.1.1Python數據清洗相關庫
8.1.2Python數據清洗庫的安裝
8.2NumPy使用
8.2.1數組的創建與使用
8.2.2計算模塊與隨機模塊的使用
8.2.3NumPy數據清洗實例
8.3Pandas使用
8.3.1Pandas數據類型概述
8.3.2Pandas數據類型應用
8.3.3Pandas數據清洗
8.4matplotlib使用
8.4.1matplotlib的介紹
8.4.2matplotlib的應用
8.5Python數據清洗實例
8.5.1清洗內部數據
8.5.2清洗外部數據
8.6本章小結
8.7實訓
習題8
第9章DataCleaner數據分析與清洗
9.1DataCleaner簡介
9.1.1DataCleaner概述
9.1.2DataCleaner界面認識
9.2DataCleaner應用
9.2.1認識DataCleaner
9.2.2DataCleaner數據分析實例
9.3本章小結
9.4實訓
習題9
第10章數據清洗綜合實訓
10.1Python數據分組與顯示
10.2Python數據清洗與顯示
10.3Kettle分組排序
10.4Kettle模糊匹配
參考文獻



