Python 網絡爬蟲與數據可視化應用實戰
陳允傑
- 出版商: 中國水利水電
- 出版日期: 2021-11-01
- 定價: $654
- 售價: 8.5 折 $556
- 語言: 簡體中文
- 頁數: 516
- 裝訂: 平裝
- ISBN: 7517090542
- ISBN-13: 9787517090540
-
相關分類:
Web-crawler 網路爬蟲
立即出貨
買這商品的人也買了...
-
$360$281 -
$505圖解Spark:核心技術與案例實戰
-
$560$437 -
$403AWS Lambda 實戰 : 開發事件驅動的無服務器應用程序 (AWS Lambda in Action: Event-Driven Serverless Applications)
-
$254亞馬遜 AWS 雲基礎與實戰
-
$474$450 -
$352關聯數據:萬維網上的結構化數據
-
$680$578 -
$356推薦系統實踐
-
$580$493 -
$580$493 -
$454Python 爬蟲技術 — 深入理解原理、技術與開發
-
$454Python 3 反爬蟲原理與繞過實戰
-
$653AWS 高級網絡官方學習指南 (專項領域) (AWS Certified Advanced Networking Official Study Guide: Specialty Exam)
-
$414$393 -
$760$646 -
$780$616 -
$1,000$790 -
$254文本數據挖掘與 Python 應用
-
$449財務報表分析與商業決策
-
$509Jupyter 金融應用 從入門到實踐
-
$600$468 -
$680$537 -
$880$748 -
$539$512
相關主題
商品描述
《Python 網絡爬蟲與數據可視化應用實戰》
是一本介紹大數據時代用 Python 進行數據獲取、數據清洗和數據可視化分析的技術圖書。
全書共分兩篇,
其中第 1 篇主要介紹了數據獲取的相關知識,具體內容包括 HTML、
JSON 與網絡爬蟲基礎,
爬取靜態網頁,使用 CSS 選擇器爬取數據,遍歷 HTML 網頁並獲取數據,使用 XPath 表達式與 Ixml 包創建爬蟲程序,
使用 Selenium 爬取動態網頁,Scrapy 爬蟲框架的使用,數據存儲等 ;
第 2 篇主要介紹數據分析及可視化相關知識,具體內容包括數據可視化基礎知識,
Pandsa 數據處理,使用 Pandas、Matplotlib、Seaborn、Bokeh 等工具進行數據分析和可視化等。
每篇均設置特別章
節進行了綜合案例演練,提高綜合水平。
《Python 網絡爬蟲與數據可視化應用實戰》一書內容豐富,涵蓋面廣,
特別適合作為大中專院校相關專業的教材,也適合作為大數據分析相關專業的自學參考書。
作者簡介
陳允傑
中國台灣地區著名信息技術作家,已出版多本人工智能、
機器學習/深度學習、數據科學、網絡爬蟲、大數據分析和物聯網相關圖書。
另外,他開發了多種幫助初學者學習程序設計的教學工具,
如fChart流程圖解釋器(可執行的流程圖),支持Python、
JavaScript和C語言的Blockly可視化積木程序編輯器,
並且將相關教學工具導入大專和中高職的圖書和程序設計教學中。
目錄大綱
篇 創建Python爬蟲程序——從網頁獲取數據
CHAPTER 1 HTML、JSON與網絡爬蟲的基礎
1-1 認識HTML
1-1-1 HTML的標籤與屬性
l-l-2 HTML網頁結構
1-2 JSON的基礎
1-2-1 認識JSON
1-2-2 JSON的語法
1-3 網絡爬蟲的概念
1-3-1 認識網絡爬蟲
1-3-2 為什麼需要網絡爬蟲
1-3-3 網絡爬蟲的基本步驟
1-4 網絡爬蟲的相關技術
1-4-1 網絡爬蟲使用的相關技術
1-4-2 使用瀏覽器瀏覽網頁的步驟
1-5 Python網絡爬蟲的相關函數庫
1-6 Spyder集成開發環境的使用
CHAPTER 2 從網絡獲取數據
2-1 認識HTTP頭部與httpbin.org服務
2-1-1 HTTP頭部
2-1-2 用開發者工具查看HTTP頭部信息
2-1-3 認識httpbin.org服務
2-2 使用Requests發送HFTF,請求
2-2-1 發送GET請求
2-2-2 發送POST請求
2-3 獲取HTTP響應內容及頭部信息
2-3-1 獲取HTTP響應內容
2-3-2 內置的響應狀態碼
2-3-3 獲取響應的HTTP頭部信息
2-4 發送進階的HTTP請求
2-4-1 訪問Cookie的HTTP請求
2-4-2 創建自定義HTTP頭部的HTTP請求
2-4-3 發送RESTful API的HTTP請求
2-4-4 發送需要認證的HTTP請求
2-4-5 使用timeout參數 請求時間
2-5 錯誤/異常處理與文件訪問
2-5-1 Requests的異常處理
2-5-2 Python文件訪問
CHAPTER 3 爬取靜態HTML網頁數據
3-1 在HTML網頁定位數據
3-1-1 網絡爬蟲的數據爬取工作
3-1-2 如何定位網頁數據
3-2 使用BeautifulSoup解析HTML網頁
3-2-1 創建BeautifulSoup對象
3-2-2 輸出解析的HTML網頁
3-2-3 BeautifulSoup的對像說明
……
第二篇 Python數據可視化——大數據分析