爬蟲在手 資料我有:7堂課學會高效率 Scrapy 爬蟲(iT邦幫忙鐵人賽系列書)
簡學群
- 出版商: 博碩
- 出版日期: 2021-03-31
- 定價: $450
- 售價: 6.6 折 $297 (限時優惠至 2025-12-31)
- 語言: 繁體中文
- 頁數: 224
- ISBN: 9864347438
- ISBN-13: 9789864347438
-
相關分類:
Web-crawler 網路爬蟲
立即出貨 (庫存 < 6)
買這商品的人也買了...
-
資安風險評估指南 (Network Security Assessment, 3/e)$780$616 -
0 陷阱!0 誤解!8 天重新認識 JavaScript!(iT邦幫忙鐵人賽系列書)$550$429 -
金魚都能懂的 CSS 選取器:金魚都能懂了你還怕學不會嗎(iT邦幫忙鐵人賽系列書)$560$437 -
突破困境:資安開源工具應用(iT邦幫忙鐵人賽系列書)$550$429 -
LINE Bot by Python 全攻略:從 Heroku 到 AWS 跨平台實踐(iT邦幫忙鐵人賽系列書)$620$484 -
PHP 網路爬蟲開發:入門到進階的爬蟲技術指南(iT邦幫忙鐵人賽系列書)$520$406 -
區塊鏈生存指南:帶你用 Python 寫出區塊鏈!(iT邦幫忙鐵人賽系列書)$520$406 -
Python x Excel VBA x JavaScript|網路爬蟲 x 實戰演練$750$638 -
Web 開發者一定要懂的駭客攻防術 (Web Security for Developers: Real Threats, Practical Defense)$420$332 -
力抗暗黑:Azure 資安天使的逆襲(iT邦幫忙鐵人賽系列書)$500$390 -
生活資安五四三!:從生活周遭看風險與資訊安全(iT邦幫忙鐵人賽系列書)$500$390 -
前端三十:從 HTML 到瀏覽器渲染的前端開發者必備心法(iT邦幫忙鐵人賽系列書)$550$429 -
改變歷史的加密訊息(iT邦幫忙鐵人賽系列書)$400$264 -
Python 刷題鍛鍊班:老手都刷過的 50 道程式題, 求職面試最給力 (Python Workout: 50 ten-minute exercises)$480$408 -
矽谷工程師教你 Kubernetes:史上最全 CI/CD 中文應用指南(iT邦幫忙鐵人賽系列書)$600$468 -
JavaScript 概念三明治:基礎觀念、語法原理一次帶走!(iT邦幫忙鐵人賽系列書)$600$468 -
JavaScript 爬蟲新思路!從零開始帶你用 Node.js 打造 FB&IG 爬蟲專案(iT邦幫忙鐵人賽系列書)$620$484 -
初學 Python 的第一本書 : 從基本語法到模組應用(iT邦幫忙鐵人賽系列書)$520$406 -
WebSecurity 網站滲透測試:Burp Suite 完全學習指南 (iT邦幫忙鐵人賽系列書)$600$468 -
Python 網路爬蟲:大數據擷取、清洗、儲存與分析 -- 王者歸來, 2/e$750$593 -
不只是工程師才要懂的 App 資訊安全:取得資安檢測合格證書血淚史(iT邦幫忙鐵人賽系列書)$600$468 -
Visual Studio Code 實用指南:官方文件沒有詳述的 Extension 觀念、命令組合技與鍵位客製化技巧(iT邦幫忙鐵人賽系列書)$600$468 -
今晚來點 Web 前端效能優化大補帖:一次搞定指標 × 工具 × 技巧,打造超高速網站(iThome鐵人賽系列書)$650$507 -
AI 世代必備!Python × ChatGPT 高效率工作術:從網路爬蟲到辦公室自動化超實務$680$530 -
LLM 大型語言模型的絕世祕笈:27路獨步劍法,帶你闖蕩生成式 AI 的五湖四海 (iThome鐵人賽系列書)$650$507
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
由淺入深了解Scrapy爬蟲框架,讓你從零開始建立高效率爬蟲!
◆自學網路爬蟲沒問題,手把手教學讓你無痛上手
◆完整的網路爬蟲和Scrapy知識,資料取得更輕鬆
◆學會各種套件和實作範例,讓你的爬蟲比別人更有效率
本書內容改編自第11屆iT邦幫忙鐵人賽的AI & Data組優選網路系列文章─《爬
蟲在手、資料我有 - 30 天 Scrapy 爬蟲實戰》。在AI的大時代中,「資料來源」
是基礎中的基礎,但網路上的資料豐富又繁雜,總不可能都靠人工來蒐集資料。
這時就是爬蟲出場的時候了!本書會帶讀者了解爬蟲的基礎知識,克服爬蟲
常見的問題,最後可以寫出維護成本低、執行效率高的爬蟲程式。
│四大重點│
★初學者必備的爬蟲指南,大大降低你的學習門檻
網路爬蟲妙計已為你爬取完成!從安裝環境、認識架構、資料儲存、
除錯到各類型網站實作,本書將一步步帶你學會網路爬蟲。
★全面解析各種知識,爬蟲能力再提升
不只教你如何進行網路爬蟲,還要帶你深入Scrapy架構,並特別介紹NoSQL、
反反爬蟲。提升你的爬蟲技能,擁有越級打怪的神力。
★活用各種套件,打造高效率爬蟲
本書將手把手帶你活用各種套件,並從範例中學會撰寫精簡有效的程式碼,
讓你克服問題、達成任務,邁向高效率的資料取得之路。
★爬取資料生活化,就像抓寶一樣好玩有趣!
你會學到如何抓取PTT、Mobile01、新聞網站、股市網站資料,你想要的各種資料都能輕鬆取得。
│適用讀者│
◆對Python有基礎了解,想要學習爬蟲程式的初學者
◆為爬蟲維護和效能所苦,想要更進一步的開發人員
【下載範例程式檔案】
本書範例檔下載網址:
https://github.com/rex-chien/ithome-scrapy
作者簡介
簡學群
在業界打滾五年的C#後端工程師。興趣使然,也斜槓於Python爬蟲、PHP、Laravel、Vue.js、Java Spring等領域,熱愛跟朋友研究和分享新技術。
連續參加第10、11屆iT邦幫忙鐵人賽且完賽,更在第11屆iT邦幫忙鐵人賽中,以《爬蟲在手、資料我有 -30 天 Scrapy 爬蟲實戰》系列文章,獲得AI & Data組優選。
目錄大綱
前言
目錄
第1章 基礎知識
1.1 安裝開發環境
1.2 網路資料常見的格式
第2章 爬蟲基礎
2.1 剖析來源資料
2.2 從網路上取得資料
第3章 基礎實戰–蒐集iThelp 文章資料
3.1 列表頁
3.2 換頁
3.3 內文
3.4 文章資訊
3.5 回文
第4章 資料持久化
4.1 PostgreSQL
4.2 NoSQL
第5章 進階爬蟲
5.1 反反爬蟲
5.2 練習其他網站
第6章 Scrapy 基礎
6.1 Scrapy 架構
6.2 開發環境
6.3 實作Scrapy爬蟲
6.4 Scrapy的結構化資料-Item
6.5 在Scrapy中處理爬取結果-Item Pipelines
6.6 在Scrapy中處理請求和回應-Downloader Middlewares
6.7 Scrapy的設定
6.8 在Scrapy中操作瀏覽器
6.9 Scrapy的日誌
6.10 蒐集Scrapy的統計資訊
6.11 發送電子郵件
第7章 實戰Scrapy
7.1 Item Pipelines應用-儲存資料到 MongoDB
7.2 在程式中啟動Scrapy爬蟲
7.3 iThelp 的Scrapy 爬蟲
7.4 中央社新聞的Scrapy 爬蟲
7.5 PTT 的Scrapy 爬蟲
7.6 相同剖析邏輯的多個資料來源
















