Python 網絡爬蟲與數據可視化應用實戰

陳允傑

  • 出版商: 中國水利水電
  • 出版日期: 2021-11-01
  • 定價: $654
  • 售價: 8.0$523
  • 語言: 簡體中文
  • 頁數: 516
  • 裝訂: 平裝
  • ISBN: 7517090542
  • ISBN-13: 9787517090540
  • 相關分類: Web-crawler 網路爬蟲
  • 立即出貨

買這商品的人也買了...

商品描述

《Python 網絡爬蟲與數據可視化應用實戰》
是一本介紹大數據時代用 Python 進行數據獲取、數據清洗和數據可視化分析的技術圖書。
全書共分兩篇,
其中第 1 篇主要介紹了數據獲取的相關知識,具體內容包括 HTML、
JSON 與網絡爬蟲基礎,
爬取靜態網頁,使用 CSS 選擇器爬取數據,遍歷 HTML 網頁並獲取數據,使用 XPath 表達式與 Ixml 包創建爬蟲程序,
使用 Selenium 爬取動態網頁,Scrapy 爬蟲框架的使用,數據存儲等 ;
第 2 篇主要介紹數據分析及可視化相關知識,具體內容包括數據可視化基礎知識,
Pandsa 數據處理,使用 Pandas、Matplotlib、Seaborn、Bokeh 等工具進行數據分析和可視化等。
每篇均設置特別章
節進行了綜合案例演練,提高綜合水平。
《Python 網絡爬蟲與數據可視化應用實戰》一書內容豐富,涵蓋面廣,
特別適合作為大中專院校相關專業的教材,也適合作為大數據分析相關專業的自學參考書。

作者簡介

陳允傑

中國台灣地區著名信息技術作家,已出版多本人工智能、
機器學習/深度學習、數據科學、網絡爬蟲、大數據分析和物聯網相關圖書。
另外,他開發了多種幫助初學者學習程序設計的教學工具,
如fChart流程圖解釋器(可執行的流程圖),支持Python、
JavaScript和C語言的Blockly可視化積木程序編輯器,
並且將相關教學工具導入大專和中高職的圖書和程序設計教學中。

目錄大綱

篇 創建Python爬蟲程序——從網頁獲取數據
CHAPTER 1 HTML、JSON與網絡爬蟲的基礎
1-1 認識HTML
1-1-1 HTML的標籤與屬性
l-l-2 HTML網頁結構
1-2 JSON的基礎
1-2-1 認識JSON
1-2-2 JSON的語法
1-3 網絡爬蟲的概念
1-3-1 認識網絡爬蟲
1-3-2 為什麼需要網絡爬蟲
1-3-3 網絡爬蟲的基本步驟
1-4 網絡爬蟲的相關技術
1-4-1 網絡爬蟲使用的相關技術
1-4-2 使用瀏覽器瀏覽網頁的步驟
1-5 Python網絡爬蟲的相關函數庫
1-6 Spyder集成開發環境的使用
CHAPTER 2 從網絡獲取數據
2-1 認識HTTP頭部與httpbin.org服務
2-1-1 HTTP頭部
2-1-2 用開發者工具查看HTTP頭部信息
2-1-3 認識httpbin.org服務
2-2 使用Requests發送HFTF,請求
2-2-1 發送GET請求
2-2-2 發送POST請求
2-3 獲取HTTP響應內容及頭部信息
2-3-1 獲取HTTP響應內容
2-3-2 內置的響應狀態碼
2-3-3 獲取響應的HTTP頭部信息
2-4 發送進階的HTTP請求
2-4-1 訪問Cookie的HTTP請求
2-4-2 創建自定義HTTP頭部的HTTP請求
2-4-3 發送RESTful API的HTTP請求
2-4-4 發送需要認證的HTTP請求
2-4-5 使用timeout參數 請求時間
2-5 錯誤/異常處理與文件訪問
2-5-1 Requests的異常處理
2-5-2 Python文件訪問
CHAPTER 3 爬取靜態HTML網頁數據
3-1 在HTML網頁定位數據
3-1-1 網絡爬蟲的數據爬取工作
3-1-2 如何定位網頁數據
3-2 使用BeautifulSoup解析HTML網頁
3-2-1 創建BeautifulSoup對象
3-2-2 輸出解析的HTML網頁
3-2-3 BeautifulSoup的對像說明
……
第二篇 Python數據可視化——大數據分析