大數據分析:Python爬蟲、數據清洗和數據可視化
黃源 蔣文豪 徐受蓉
- 出版商: 清華大學
- 出版日期: 2020-01-01
- 定價: $359
- 售價: 7.9 折 $284
- 語言: 簡體中文
- 頁數: 320
- ISBN: 7302530548
- ISBN-13: 9787302530541
-
相關分類:
Python、Web-crawler 網路爬蟲、Data-visualization
立即出貨
買這商品的人也買了...
-
$403AWS Lambda 實戰 : 開發事件驅動的無服務器應用程序 (AWS Lambda in Action: Event-Driven Serverless Applications) -
$254亞馬遜 AWS 雲基礎與實戰 -
$352關聯數據:萬維網上的結構化數據 -
大數據時代一定要會的 SQL 商業資料分析術$680$578 -
優雅的 SciPy|Python 科學研究的美學 (Elegant SciPy: The Art of Scientific Python)$580$458 -
推薦系統實踐$419$398 -
Python 網路爬蟲與資料分析入門實戰$450$351 -
$403Python 網絡爬蟲實戰, 2/e -
別說你不懂理財!善用 Python 幫助你投資獲利,改善財務$350$298 -
$469Python程序設計與問題求解(原書第2版) -
$236Python Web 開發基礎教程 (Django版)(微課版) -
$454Python 3 反爬蟲原理與繞過實戰 -
$327深度學習入門 : 基於 PyTorch 和 TensorFlow 的理論與實現 -
$370Python機器學習核心算法編程實例 -
$469Python數據分析從入門到精通 -
$768AWS 高級網絡官方學習指南 (專項領域) (AWS Certified Advanced Networking Official Study Guide: Specialty Exam) -
$564Python人工智能開發從入門到精通 -
$280Python 深度學習應用 (Applied Deep Learning with Python: Use scikit-learn, TensorFlow, and Keras to create intelligent systems and machine learning solutions) -
$327Python數據科學實踐 -
$352RPA (流程自動化機器人) 入門 — 手把手教你應用 UiPath 自動化工作 -
$374信息社會必修的12堂Python通識課 -
Python 刷題鍛鍊班:老手都刷過的 50 道程式題, 求職面試最給力 (Python Workout: 50 ten-minute exercises)$480$408 -
$284Flask開發Web搜索引擎入門與實戰 -
深入淺出 Java 程式設計, 3/e (Head First Java, 3/e)$980$774 -
資料視覺化:用 Python 為星空作畫$720$569
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
在全書中介紹了大數據概述、爬蟲與大數據相關技術、Scrapy 爬蟲、數據庫連接與查詢、數據可視化、數據存儲與清洗概述 、數據格式與編碼技術介紹、數據抽取與採集、pandas 數據清洗。每個階段都重點強化實訓,實現了理論與實踐的結合。教材中應用案例來展開知識點的講解,對重要的、核心的知識點加大練習的比例,以達到熟練運用的目的。
目錄大綱
第1章 大數據
1.1 大數據概述
1.1.1 大數據介紹
1.1.2 大數據的特征
1.1.3 大數據技術應用與基礎
1.2 大數據的意義
1.2.1 大數據的國家戰略意義
1.2.2 大數據的企業意義
1.2.3 我國大數據市場的預測
1.3 大數據的產業鏈分析
1.3.1 技術分析
1.3.2 運營分析
1.4 本章小結
1.5 實訓
習題
第2章 爬蟲與大數據
2.1 爬蟲概述
2.1.1 爬蟲介紹
2.1.2 爬蟲的地位與作用
2.2 Python介紹
2.2.1 Python開發環境搭建
2.2.2 編寫Python程序
2.2.3 Python數據類型
2.3 爬蟲相關知識
2.3.1 了解網頁結構
2.3.2 Python與爬蟲
2.3.3 基礎爬蟲框架
2.4 利用爬蟲抓取網頁內容
2.4.1 觀察與分析頁面
2.4.2 抓取過程分析
2.4.3 獲取頁面內容
2.5 本章小結
2.6 實訓
習題
第3章 Scrapy爬蟲
3.1 Scrapy爬蟲概述
3.2 Scrapy原理
3.2.1 Scrapy框架的架構
3.2.2 Request對象和Response對象
3.2.3 Select對象
3.2.4 Spider開發流程
3.3 Scrapy的開發與實現
3.3.1 Scrapy爬蟲開發流程
3.3.2 創建Scrapy項目並查看結構
3.3.3 編寫代碼並運行爬蟲
3.4 本章小結
3.5 實訓
習題
第4章 數據庫連接與查詢
4.1 數據庫
4.1.1 數據庫概述
4.1.2 關系數據庫設計
4.2 MySQL數據庫
4.2.1 MySQL數據庫概述
4.2.2 MySQL數據庫下載、安裝與運行
4.2.3 MySQL數據庫命令行入門
4.3 使用Python操作MySQL數據庫
4.3.1 pymysql安裝與使用
4.3.2 Python連接MySQL數據庫
4.4 本章小結
4.5 實訓
習題
第5章 數據可視化基礎與應用
5.1 數據可視化
5.1.1 數據可視化概述
5.1.2 數據可視化工具
5.1.3 數據可視化圖表
5.2 matplotlib可視化基礎
5.2.1 numpy庫
5.2.2 matplotlib認識與安裝
5.2.3 matplotlib測試
5.2.4 matplotlib.pyplot庫
5.3 matplotlib可視化繪圖
5.3.1 繪制線性圖形
5.3.2 繪制柱狀圖形
5.3.3 繪制直方圖
5.3.4 繪制散點圖
5.3.5 繪制極坐標圖
5.3.6 繪制餅圖
5.4 pyecharts可視化應用
5.5 本章小結
5.6 實訓
習題
第6章 大數據存儲與清洗
6.1 大數據存儲
6.2 數據清洗
6.2.1 數據清洗概述
6.2.2 數據清洗的原理
6.2.3 數據清洗的流程
6.2.4 數據清洗的工具
6.3 數據標準化
6.3.1 數據標準化的概念
6.3.2 數據標準化的方法
6.3.3 數據標準化的實例
6.4 本章小結
6.5 實訓
習題
第7章 數據格式與編碼技術
7.1 文件格式
7.2 數據類型與編碼
7.2.1 數據類型概述
7.2.2 字符編碼
7.2.3 數據轉換
7.3 Kettle數據清洗與轉換工具的使用
7.3.1 Kettle概述
7.3.2 Kettle的安裝與使用
7.4 CSV格式的數據轉換
7.4.1 CSV格式概述
7.4.2 CSV與JSON文件的轉換
7.5 本章小結
7.6 實訓
習題
第8章 數據抽取與采集
8.1 數據抽取
8.2 文本抽取與實現
8.2.1 文本文件抽取
8.2.2 CSV文件抽取
8.2.3 JSON文件抽取
8.3 網頁數據抽取與實現
8.3.1 網頁數據抽取
8.3.2 Excel抽取網頁數據
8.3.3 Kettle抽取網頁數據
8.4 數據采集與實現
8.5 本章小結
8.6 實訓
習題
第9章 pandas數據分析與清洗
9.1 認識pandas
9.2 pandas語法與使用
9.3 pandas讀取與清洗數據
9.3.1 數據準備
9.3.2 從CSV中讀取數據
9.3.3 pandas數據清洗
9.4 pandas數據可視化
9.4.1 pandas繪圖概述
9.4.2 pandas繪圖方法
9.5 本章小結
9.6 實訓
習題
第10章 數據分析與清洗綜合實訓
10.1 數據清洗實訓
10.1.1 使用Kettle對生成的隨機數實現字段選擇
10.1.2 使用Kettle連接不同的數據表
10.1.3 使用Kettle過濾數據表
10.1.4 使用Kettle連接MySQL數據庫,並輸出查詢結果
10.2 數據分析實訓
10.3 本章小結
習題



