Python 網絡爬蟲實戰
呂雲翔 張揚
- 出版商: 清華大學
- 出版日期: 2019-05-01
- 定價: $479
- 售價: 7.9 折 $378
- 語言: 簡體中文
- 頁數: 391
- ISBN: 7302515921
- ISBN-13: 9787302515920
-
相關分類:
Web-crawler 網路爬蟲
立即出貨
買這商品的人也買了...
-
$403AWS Lambda 實戰 : 開發事件驅動的無服務器應用程序 (AWS Lambda in Action: Event-Driven Serverless Applications) -
$403程序員的數學2 : 概率統計 -
$147程序員的數學 -
$403Python 網絡爬蟲實戰, 2/e -
$654機器學習與應用 -
$594實戰 Python 網絡爬蟲 -
$507Python 爬蟲技術 — 深入理解原理、技術與開發 -
強化式學習:打造最強 AlphaZero 通用演算法$780$663 -
Kaggle 競賽攻頂秘笈 -- 揭開 Grandmaster 的特徵工程心法,掌握制勝的關鍵技術$1,000$850 -
深度強化式學習 (Deep Reinforcement Learning in Action)$1,000$790 -
$352TensorFlow 語音識別實戰 -
$301TensorFlow 人臉識別實戰 -
$284Python 網絡爬蟲與數據採集 -
$281基於Python的概率論與數理統計實驗 -
$403Python 網絡爬蟲框架 Scrapy 從入門到精通 -
穿越作業系統迷霧:從零實現作業系統$594$564 -
$607Python 爬蟲從菜鳥到高手 -
$458AI大模型開發之路:從入門到實踐 -
全面掌握 Gemini 開發實務:輕鬆駕馭 Google AI 引擎$680$537 -
$505從零開始寫 Linux 內核 (一書學透核心原理與實現) -
$607算法競賽入門筆記 -
$510零基礎開發 AI Agent:手把手教你用釦子做智能體 -
人人都會 AI 繪圖:開啟斜槓人生金鑰匙,2000件生成作品 + 完整提示詞(全書中英文提示詞,立即下載使用)$780$585 -
開源閉源 LLM 應用 - 從微調到 RAG、Agent 完整開發實作$880$695 -
Microsoft Azure AI Services 與 Azure OpenAI 開發基礎必修課 -- 使用 C#$550$435
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書介紹如何利用Python進行網絡爬蟲程序的開發,從Python語言的基本特性入手,詳細介紹了Python爬蟲開發的相關知識,涉及HTTP、HTML、JavaScript、正則表達式、自然語言處理、數據科學等內容。全書共分為14章,包括Python基礎知識、網站分析、網頁解析、Python文件的讀寫、Python與數據庫、AJAX技術、模擬登錄、文本與數據分析、網站測試、Scrapy爬蟲框架、爬蟲性能等多個主題,內容覆蓋網絡抓取與爬蟲編程中的主要知識和技術,在重視理論基礎的前提下從實用性和豐富度出發,結合實例演示了編寫爬蟲程序的核心流程。 本書適合Python語言初學者、網絡爬蟲技術愛好者、數據分析從業人員以及高等院校電腦科學、軟件工程等相關專業的師生閱讀。
目錄大綱
基礎篇
第1章Python與網絡爬蟲
1.1 Python語言
1.1.1什麼是Python
1.1.2 Python的應用現狀
1.2 Python的安裝與開發環境配置
1.2.1在Windows上安裝
1.2.2在Ubuntu和Mac OS上安裝
1.2.3 PyCharm的使用
1.2.4 Jupyter Notebook
1.3 Python的基本語法
1.3.1數據類型
1.3.2邏輯語句
1.3.3 Python中的函數與類
1.3.4如何學習Python
1.4因特網、HTTP與HTML
1.4.1因特網與HTTP協議
1.4.2 HTML
1.5 HelloSpider
1.5.1第一個爬蟲程序
1.5.2對爬蟲程序的思考
1.6調研網站
1.6.1網站的robots.txt與Sitemap
1.6.2查看網站所用的技術
1.6.3查看網站所有者的信息
1.6.4使用開發者工具檢查網頁
1.7本章小結
第2章數據的採集
2.1從抓取開始
2.2正則表達式
2.2.1初識正則表達式
2.2.2正則表達式的簡單使用
2.3 BeautifulSoup
2.3.1 BeautifulSoup的安裝與特點
2.3.2 BeautifulSoup的基本使用
2.4 XPath與lxml
2.4.1 XPath
2.4.2 lxml與XPath的使用
2.5遍歷頁面
2.5.1抓取下一個頁面
2.5.2完成爬蟲程序
2.6使用API
2.6.1 API簡介
2.6.2 API使用示例
2.7本章小結
第3章文件與數據的存儲
3.1 Python中的文件
3.1.1基本的文件讀寫
3.1.2序列化
3.2字符串
3.3 Python與圖片
3.3.1 PIL與Pillow
3.3.2 Python與OpenCV簡介
……
進階篇
第4章JavaScript與動態內容
第5章表單與模擬登錄
第6章數據的進一步處理
高級篇
第7章更靈活和更多樣的爬蟲
第8章瀏覽器模擬與網站測試
第9章更強大的爬蟲
實踐篇
第10章爬蟲實踐:下載網頁中的小說和購物評論
第11章爬蟲實踐:保存感興趣的圖片
第12章爬蟲實踐:網上影評分析
第13章爬蟲實踐:使用爬蟲下載網頁
第14章爬蟲實踐:使用爬蟲框架
附錄A
參考文獻



