大數據分析:Python 爬蟲、數據清洗和數據可視化, 2/e (微課視頻版)
黃源,蔣文豪,龍穎
- 出版商: 清華大學
- 出版日期: 2022-09-01
- 定價: $359
- 售價: 7.9 折 $284
- 語言: 簡體中文
- 頁數: 339
- ISBN: 7302605238
- ISBN-13: 9787302605232
-
相關分類:
Python、Web-crawler 網路爬蟲、Data-visualization
立即出貨
買這商品的人也買了...
-
實戰機器學習|以深度學習演算企業資料$450$383 -
$505Python 安全攻防:滲透測試實戰指南 -
$374Web 安全 360度全面防護 -
$539Flutter 內核源碼剖析 -
VMware vSphere 7.x 維運實戰管理祕訣$550$435 -
FB、IG 互動濾鏡超級玩家:Spark AR 擴增實境玩創意$450$383 -
$469Serverless 架構下的 AI 應用開發:入門、實戰與性能優化 -
$347大數據導論(第2版)(微課版) -
$236大數據技術入門(微課視頻+題庫版) -
$305強化學習 -
$236NoSQL數據庫從入門到實戰(微課視頻版) -
$422對偶學習 -
現代決策樹模型及其編程實踐:從傳統決策樹到深度決策樹$774$735 -
$564機器學習:從基礎理論到典型算法(原書第2版) -
Python 資料科學實戰教本 - 爬蟲、清理、資料庫、視覺化、探索式分析、機器學習建模,數據工程一次搞定!$680$578 -
$407自己動手做聊天機器人 -
$426R & Python 數據科學與機器學習實踐 -
$607Python 漫遊數學王國 — 高等數學、線性代數、數理統計及運籌學 -
$607Python Web 深度學習 -
Python 數據清洗$714$678 -
前端性能揭秘$600$570 -
$374動手學推薦系統 — 基於 PyTorch 的算法實現 (微課視頻版) -
GitLab CI/CD 從入門到實戰$479$455 -
Elasticsearch 數據搜索與分析實戰$599$569 -
$305網絡攻防實訓 (微課視頻版)
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
VIP 95折
深入淺出 SSD 測試 : 固態存儲測試流程 方法與工具$594$564 -
VIP 95折
MCP 開發從入門到實戰$515$489 -
85折
$806Linux x64 匯編語言編程 -
VIP 95折
MCP 極簡開發 : 輕鬆打造高效智能體$479$455 -
VIP 95折
RISC-V 架構 DSP 處理器設計$534$507 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
85折
$454RAG 實踐權威指南:構建精準、高效大模型之道 -
VIP 95折
CUDA 並行編程與性能優化$714$678 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
VIP 95折
大模型驅動的具身智能 架構,設計與實現$534$507 -
VIP 95折
納米級CMOS VLSI電路(可制造性設計)$474$450 -
VIP 95折
Manus應用與AI Agent設計指南:從入門到精通$359$341 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
VIP 95折
芯片的較量 (日美半導體風雲)$414$393 -
VIP 95折
Manus AI 智能體從入門到精通$294$279 -
87折
$981深度學習:基礎與概念 -
85折
$505GitHub Copilot 編程指南 -
87折
$469Cursor 與 Copilot 開發實戰 : 讓煩瑣編程智能化 -
85折
$551C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
Verilog HDL 計算機網絡典型電路算法設計與實現$354$336 -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
85折
$806Linux x64 匯編語言編程 -
VIP 95折
MCP 極簡開發 : 輕鬆打造高效智能體$479$455 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
85折
$505GitHub Copilot 編程指南 -
85折
$551C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673 -
VIP 95折
深入淺出 Docker, 2/e$419$398 -
85折
$658Unity 特效制作:Shader Graph 案例精講 -
79折
$275零基礎玩轉國產大模型DeepSeek -
VIP 95折
人工智能大模型:機器學習基礎$774$735 -
VIP 95折
RAG 極簡入門:原理與實踐$419$398 -
VIP 95折
大模型實戰 : 從零實現 RAG 與 Agent 系統$419$398 -
VIP 95折
算法趣學(第2版)$348$331 -
VIP 95折
大模型理論與實踐——打造行業智能助手$354$336 -
VIP 95折
大模型應用開發 RAG 實戰課$599$569 -
85折
$509生成式人工智能 (基於 PyTorch 實現) -
VIP 95折
機器人抓取力學$894$849 -
VIP 95折
集成電路版圖設計從入門到精通$474$450 -
VIP 95折
Java 學習筆記, 6/e$839$797
相關主題
商品描述
本書的編寫目的是向讀者介紹大數據分析的基本概念和相應的技術應用。全書共10章,分別介紹大數據概述、爬蟲和大數據相關技術、Scrapy爬蟲、Python與MySQL數據庫連接與查詢、數據可視化基礎與應用、大數據存儲與清洗、數據格式與編碼技術、數據抽取與採集、pandas數據分析與清洗以及綜合實訓。本書將理論與實踐操作相結合,通過大量的案例幫助讀者快速瞭解和應用大數據分析相關技術,並對書中重要的、核心的知識點加大練習的比例,以達到熟練應用的目的。 本書可作為高等院校大數據專業、人工智能專業、軟件技術專業、雲計算專業、電腦網絡專業的專業課教材,也可作為大數據愛好者的參考書。
目錄大綱
源碼下載
目錄
第1章大數據
1.1大數據概述
1.1.1大數據介紹
1.1.2大數據的特徵
1.1.3大數據技術基礎
1.1.4大數據應用
1.2大數據的意義
1.2.1大數據的國家戰略意義
1.2.2大數據的企業意義
1.2.3我國大數據市場的預測
1.3大數據的產業鏈分析
1.3.1技術分析
1.3.2運營分析
1.4本章小結
1.5實訓
習題
第2章爬蟲與大數據
2.1爬蟲概述
2.1.1爬蟲介紹
2.1.2爬蟲的地位與作用
2.2Python介紹
2.2.1Python開發環境的搭建
2.2.2編寫Python程序
2.2.3Python數據類型
2.3爬蟲相關知識
2.3.1瞭解網頁結構
2.3.2Python與爬蟲
2.3.3基礎爬蟲框架
2.3.4正則表達式
2.4利用爬蟲抓取網頁內容
2.4.1觀察與分析頁面
2.4.2抓取過程分析
2.4.3獲取頁面內容
2.5本章小結
2.6實訓
習題
第3章Scrapy爬蟲
3.1Scrapy爬蟲概述
3.2Scrapy原理
3.2.1Scrapy框架的架構
3.2.2Request對象和Response對象
3.2.3Select對象
3.2.4Spider開發流程
3.3Scrapy的開發與實現
3.3.1Scrapy爬蟲的開發流程
3.3.2創建Scrapy項目並查看結構
3.3.3編寫代碼並運行爬蟲
3.4本章小結
3.5實訓
習題
第4章數據庫連接與查詢
4.1數據庫
4.1.1數據庫概述
4.1.2關系數據庫設計
4.2MySQL數據庫
4.2.1MySQL數據庫概述
4.2.2MySQL數據庫的下載、安裝與運行
4.2.3MySQL數據庫命令行入門
4.3使用Python操作MySQL數據庫
4.3.1pymysql的安裝與使用
4.3.2使用Python連接MySQL數據庫
4.4本章小結
4.5實訓
習題
第5章數據可視化基礎與應用
5.1數據可視化
5.1.1數據可視化概述
5.1.2數據可視化工具
5.1.3數據可視化圖表
5.2matplotlib可視化基礎
5.2.1numpy庫
5.2.2matplotlib的認識與安裝
5.2.3matplotlib測試
5.2.4matplotlib.pyplot庫
5.3matplotlib可視化繪圖
5.3.1繪制線性圖形
5.3.2繪制柱狀圖
5.3.3繪制直方圖
5.3.4繪制散點圖
5.3.5繪制極坐標圖
5.3.6繪制餅圖
5.4pyecharts可視化應用
5.5本章小結
5.6實訓
習題
第6章大數據存儲與清洗
6.1大數據存儲
6.2數據清洗
6.2.1數據清洗概述
6.2.2數據清洗的原理
6.2.3數據清洗的流程
6.2.4數據清洗的工具
6.3數據標準化
6.3.1數據標準化的概念
6.3.2數據標準化的方法
6.3.3數據標準化的實例
6.4本章小結
6.5實訓
習題
第7章數據格式與編碼技術
7.1文件格式
7.2數據類型與編碼
7.2.1數據類型概述
7.2.2字符編碼
7.2.3數據轉換
7.3Kettle數據清洗與轉換工具的使用
7.3.1Kettle概述
7.3.2Kettle的安裝與使用
7.4CSV格式的數據轉換
7.4.1CSV格式概述
7.4.2CSV與JSON文件的轉換
7.5本章小結
7.6實訓
習題
第8章數據抽取與採集
8.1數據抽取
8.2文本抽取與實現
8.2.1文本文件的抽取
8.2.2CSV文件的抽取
8.2.3JSON文件的抽取
8.3網頁數據抽取與實現
8.3.1網頁數據抽取
8.3.2Excel抽取網頁數據
8.3.3Kettle抽取網頁數據
8.4數據採集與實現
8.5本章小結
8.6實訓
習題
第9章pandas數據分析與清洗
9.1認識pandas
9.2pandas的語法與使用
9.3pandas讀取與清洗數據
9.3.1數據準備
9.3.2從CSV中讀取數據
9.3.3pandas數據清洗
9.4pandas數據可視化
9.4.1pandas繪圖概述
9.4.2pandas繪圖方法
9.5本章小結
9.6實訓
習題
第10章綜合實訓
10.1數據清洗實訓
10.1.1使用Kettle對生成的隨機數實現字段選擇
10.1.2使用Kettle連接不同的數據表
10.1.3使用Kettle過濾數據表
10.1.4使用Kettle連接MySQL數據庫並輸出查詢結果
10.2數據分析實訓
10.3本章小結
習題
參考文獻



