Python 爬蟲從菜鳥到高手
李寧
- 出版商: 清華大學
- 出版日期: 2023-09-01
- 售價: $714
- 貴賓價: 9.5 折 $678
- 語言: 簡體中文
- 頁數: 460
- 裝訂: 平裝
- ISBN: 7302640513
- ISBN-13: 9787302640516
-
相關分類:
Web-crawler 網路爬蟲
立即出貨
買這商品的人也買了...
-
$2,130$2,024 -
$550$468 -
$590$502 -
$354$336 -
$560$403 -
$199C# 網絡程序開發, 2/e
-
$474$450 -
$454中台實踐:數字化轉型方法論與解決方案
-
$594$564 -
$240$216 -
$680$537 -
$450$324 -
$620$490 -
$1,080$778 -
$653Python超能學習手冊
-
$780$562 -
$479$455 -
$680$490 -
$880$634 -
$680$490 -
$299$284 -
$980$774 -
$1,014$963 -
$1,200$864 -
$680$490
商品描述
本書從實戰角度系統論述了Python 爬蟲技術的核心知識,並通過大量的真實項目幫助讀者深入掌握Python 爬蟲技術及其實現。本書提供了大量實戰案例,演繹採用各種技術編寫Python 爬蟲的方式。讀者可以任意組合使用這些技術,完成非常復雜的爬蟲應用。本書共20 章,分為五篇。第一篇:基礎知識(第1~2 章),主要包括Python 編程環境的搭建、IDE 的安裝和使用、HTTP 的基礎知識、網頁基礎(HTML、CSS、JavaScript)、爬蟲的基本原理、Session、Cookie。第二篇:網絡庫(第3~5 章),主要包括網絡庫urllib、urllib3 和requests 的核心使用方法,例如,發送HTTP 請求、處理超時、設置HTTP 請求頭、處理中文字符、搭建和使用代理、解析鏈接、Robots 協議等。第三篇:解析庫(第6~9 章),主要包括3 個常用解析庫(lxml、Beautiful Soup 和pyquery)的使用方法,同時介紹了多種用於分析HTML 代碼的技術,例如,正則表達式、XPath、CSS 選擇器、方法選擇器等。第四篇:數據存儲(第10~11 章),主要包括Python 中數據存儲的解決方案,如文件存儲和SQLite 數據庫。第五篇:爬蟲高級應用(第12~20 章),主要包括Python 爬蟲的一些高級技術,如抓取異步數據、Selenium、Splash、抓取移動App 數據、Appium、多線程爬蟲、爬蟲框架Scrapy、通過OpenCV 技術識別驗證碼;最後給出一個綜合的實戰案例,該案例綜合了Python 爬蟲、數據存儲、PyQt、多線程、數據可視化、Web 等多種技術實現一個可視化爬蟲。