大數據分析:Python 爬蟲、數據清洗和數據可視化, 2/e (微課視頻版)
黃源,蔣文豪,龍穎
- 出版商: 清華大學
- 出版日期: 2022-09-01
- 定價: $359
- 售價: 7.9 折 $284
- 語言: 簡體中文
- 頁數: 339
- ISBN: 7302605238
- ISBN-13: 9787302605232
-
相關分類:
Python、Web-crawler 網路爬蟲、Data-visualization
立即出貨
買這商品的人也買了...
-
實戰機器學習|以深度學習演算企業資料$450$356 -
$505Python 安全攻防:滲透測試實戰指南 -
$374Web 安全 360度全面防護 -
$539Flutter 內核源碼剖析 -
VMware vSphere 7.x 維運實戰管理祕訣$550$435 -
FB、IG 互動濾鏡超級玩家:Spark AR 擴增實境玩創意$450$338 -
$469Serverless 架構下的 AI 應用開發:入門、實戰與性能優化 -
$347大數據導論(第2版)(微課版) -
$236大數據技術入門(微課視頻+題庫版) -
$305強化學習 -
$236NoSQL數據庫從入門到實戰(微課視頻版) -
$422對偶學習 -
現代決策樹模型及其編程實踐:從傳統決策樹到深度決策樹$774$735 -
$564機器學習:從基礎理論到典型算法(原書第2版) -
Python 資料科學實戰教本 - 爬蟲、清理、資料庫、視覺化、探索式分析、機器學習建模,數據工程一次搞定!$680$537 -
$407自己動手做聊天機器人 -
$426R & Python 數據科學與機器學習實踐 -
$607Python 漫遊數學王國 — 高等數學、線性代數、數理統計及運籌學 -
$607Python Web 深度學習 -
Python 數據清洗$714$678 -
$510前端性能揭秘 -
$374動手學推薦系統 — 基於 PyTorch 的算法實現 (微課視頻版) -
$479GitLab CI/CD 從入門到實戰 -
Elasticsearch 數據搜索與分析實戰$599$569 -
$305網絡攻防實訓 (微課視頻版)
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
75折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$375 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書的編寫目的是向讀者介紹大數據分析的基本概念和相應的技術應用。全書共10章,分別介紹大數據概述、爬蟲和大數據相關技術、Scrapy爬蟲、Python與MySQL數據庫連接與查詢、數據可視化基礎與應用、大數據存儲與清洗、數據格式與編碼技術、數據抽取與採集、pandas數據分析與清洗以及綜合實訓。本書將理論與實踐操作相結合,通過大量的案例幫助讀者快速瞭解和應用大數據分析相關技術,並對書中重要的、核心的知識點加大練習的比例,以達到熟練應用的目的。 本書可作為高等院校大數據專業、人工智能專業、軟件技術專業、雲計算專業、電腦網絡專業的專業課教材,也可作為大數據愛好者的參考書。
目錄大綱
源碼下載
目錄
第1章大數據
1.1大數據概述
1.1.1大數據介紹
1.1.2大數據的特徵
1.1.3大數據技術基礎
1.1.4大數據應用
1.2大數據的意義
1.2.1大數據的國家戰略意義
1.2.2大數據的企業意義
1.2.3我國大數據市場的預測
1.3大數據的產業鏈分析
1.3.1技術分析
1.3.2運營分析
1.4本章小結
1.5實訓
習題
第2章爬蟲與大數據
2.1爬蟲概述
2.1.1爬蟲介紹
2.1.2爬蟲的地位與作用
2.2Python介紹
2.2.1Python開發環境的搭建
2.2.2編寫Python程序
2.2.3Python數據類型
2.3爬蟲相關知識
2.3.1瞭解網頁結構
2.3.2Python與爬蟲
2.3.3基礎爬蟲框架
2.3.4正則表達式
2.4利用爬蟲抓取網頁內容
2.4.1觀察與分析頁面
2.4.2抓取過程分析
2.4.3獲取頁面內容
2.5本章小結
2.6實訓
習題
第3章Scrapy爬蟲
3.1Scrapy爬蟲概述
3.2Scrapy原理
3.2.1Scrapy框架的架構
3.2.2Request對象和Response對象
3.2.3Select對象
3.2.4Spider開發流程
3.3Scrapy的開發與實現
3.3.1Scrapy爬蟲的開發流程
3.3.2創建Scrapy項目並查看結構
3.3.3編寫代碼並運行爬蟲
3.4本章小結
3.5實訓
習題
第4章數據庫連接與查詢
4.1數據庫
4.1.1數據庫概述
4.1.2關系數據庫設計
4.2MySQL數據庫
4.2.1MySQL數據庫概述
4.2.2MySQL數據庫的下載、安裝與運行
4.2.3MySQL數據庫命令行入門
4.3使用Python操作MySQL數據庫
4.3.1pymysql的安裝與使用
4.3.2使用Python連接MySQL數據庫
4.4本章小結
4.5實訓
習題
第5章數據可視化基礎與應用
5.1數據可視化
5.1.1數據可視化概述
5.1.2數據可視化工具
5.1.3數據可視化圖表
5.2matplotlib可視化基礎
5.2.1numpy庫
5.2.2matplotlib的認識與安裝
5.2.3matplotlib測試
5.2.4matplotlib.pyplot庫
5.3matplotlib可視化繪圖
5.3.1繪制線性圖形
5.3.2繪制柱狀圖
5.3.3繪制直方圖
5.3.4繪制散點圖
5.3.5繪制極坐標圖
5.3.6繪制餅圖
5.4pyecharts可視化應用
5.5本章小結
5.6實訓
習題
第6章大數據存儲與清洗
6.1大數據存儲
6.2數據清洗
6.2.1數據清洗概述
6.2.2數據清洗的原理
6.2.3數據清洗的流程
6.2.4數據清洗的工具
6.3數據標準化
6.3.1數據標準化的概念
6.3.2數據標準化的方法
6.3.3數據標準化的實例
6.4本章小結
6.5實訓
習題
第7章數據格式與編碼技術
7.1文件格式
7.2數據類型與編碼
7.2.1數據類型概述
7.2.2字符編碼
7.2.3數據轉換
7.3Kettle數據清洗與轉換工具的使用
7.3.1Kettle概述
7.3.2Kettle的安裝與使用
7.4CSV格式的數據轉換
7.4.1CSV格式概述
7.4.2CSV與JSON文件的轉換
7.5本章小結
7.6實訓
習題
第8章數據抽取與採集
8.1數據抽取
8.2文本抽取與實現
8.2.1文本文件的抽取
8.2.2CSV文件的抽取
8.2.3JSON文件的抽取
8.3網頁數據抽取與實現
8.3.1網頁數據抽取
8.3.2Excel抽取網頁數據
8.3.3Kettle抽取網頁數據
8.4數據採集與實現
8.5本章小結
8.6實訓
習題
第9章pandas數據分析與清洗
9.1認識pandas
9.2pandas的語法與使用
9.3pandas讀取與清洗數據
9.3.1數據準備
9.3.2從CSV中讀取數據
9.3.3pandas數據清洗
9.4pandas數據可視化
9.4.1pandas繪圖概述
9.4.2pandas繪圖方法
9.5本章小結
9.6實訓
習題
第10章綜合實訓
10.1數據清洗實訓
10.1.1使用Kettle對生成的隨機數實現字段選擇
10.1.2使用Kettle連接不同的數據表
10.1.3使用Kettle過濾數據表
10.1.4使用Kettle連接MySQL數據庫並輸出查詢結果
10.2數據分析實訓
10.3本章小結
習題
參考文獻



