Python 網絡爬蟲開發從入門到精通

劉延林

買這商品的人也買了...

商品描述

本書共分 3 篇,針對 Python 爬蟲初學者,
從零開始,系統地講解瞭如何利用 Python 
進行常見的網絡爬蟲的程序開發。
第 1 篇快速入門篇(第 1 章 ~ 第 9 章):
本篇主要介紹了 Python 環境的搭建和一些 Python 的基礎語法知識等、
Python爬蟲入門知識及基本的使用方法、Ajax 數據的分析和抓取、
動態渲染頁面數據的爬取、網站代理的設置與使用、驗證碼的識別與破解,
以及 App 數據抓取、數據的存儲方法等內容。
第 2 篇技能進階篇(第 10 章 ~ 第 12 章):
本篇主要介紹了 PySpider 和 Scrapy 兩個常用爬蟲框架的基本使用方法、
分佈式爬蟲的實現思路,以及數據分析、數據清洗常用庫的使用方法。
第 3 篇項目實戰篇(第 13 章):本篇通過 6 個綜合實戰項目,
詳細地講解了 Python 數據爬蟲開始與實戰應用。
本篇對全書內容進行了總結回顧,強化讀者的實操水平。
本書案例豐富,註重實戰,既適合 Python 程序員和爬蟲愛好者閱讀學習,
也適合作為廣大職業院校相關專業的教學用書。

作者簡介

劉延林

知名論壇Python爬蟲專題管理員,
擅長Python爬蟲技術,並對Python數據分析與挖掘有深入研究。
在CSDN等多個知名博客網站發表多篇技術文章,深受讀者的喜愛。

目錄大綱

第1篇 快速入門篇
第1章 Python基礎
1.1 Python環境搭建
1.1.1 windows系統下的Python環境安裝與配置
1.1.2 Linux系統下的Python環境安裝
1.1.3 Mac OS X系統搭建Python 3
1.1.4 IDE開發工具介紹
1.2 Python編程入門
1.2.1 第一個Python程序
1.2.2 Python註釋
1.2.3數據類型和變量
1.2.4 字符串和編碼
1.2.5 列表
1.2.6 元組
1.2.7 字典
1.2.8 條件語句
1.2.9 循環語句
1.2.10 函數
1.2.11 類
1.3 新手實訓
1.4 新手問答
本章小結
第2章 Python爬蟲入門
2.1 爬蟲的分類
2.1.1 通用網絡爬蟲
2.1.2 聚焦網絡爬蟲
2.1.3 增量式網絡爬蟲
2.1.4 深層網絡爬蟲
2.2 爬蟲的基本結構和工作流程
2.3 爬蟲策略
2.3.1 深度優先遍歷策略
2.3.2 寬度優先遍歷策略
2.3.3 大站優先策略
2.3.4 最佳優先搜索策略
2.4 HTTP的基本原理
2.4.1 URI和URI介紹
2.4.2 超文本
2.4.3 HTTP和HTTPS
2.4.4 HTTP的請求過程
2.5 網頁基礎
2.5.1 網頁的組成
2.5.2 網頁的結構
2.6 Session和Cookie
2.6.1 Session和Cookie的基本原理
2.6.2 Session和Cookie的區別
2.63 常見誤區
2.7 新手實訓
2.8 新手問答
本章小結
第3章 基本庫的使用
3.1 urllib
3.1.1 urlopen()
3.1.2 簡單抓取網頁
3.1.3 設置請求超時
……
第2篇 技能進階篇
第3篇 項目實戰篇