LLM × 網路爬蟲終極實戰：n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent

陳會安著

預覽內頁

出版商: 旗標
出版日期: 2025-11-27
定價: $980
售價: 7.9 折 $774
語言: 繁體中文
頁數: 576
ISBN: 9863128503
ISBN-13: 9789863128502
相關分類: Web-crawler 網路爬蟲、Large language model

立即出貨 (庫存 > 10)

LLM × 網路爬蟲終極實戰：n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent-preview-1

買這商品的人也買了...

$517

穿越作業系統迷霧：從零實現作業系統
~~$650~~ $487

生成式 AI 專案實踐指南：從模型挑選、上線、RAG 技術到 AI Agent 整合
~~$680~~ $530

AI Agent 奇幻旅程：MCP 通往異世界金鑰（含最新 OpenAI GPT-5 範例）
~~$750~~ $592

本地端 Ollama × LangChain × LangGraph × LangSmith 開發手冊：打造 RAG、Agent、SQL 應用
~~$750~~ $592

Ollama 本地 AI 全方位攻略：命令列功能、五大主題測試、RAG、Vibe Coding、MCP，一本搞定所有實戰應用
~~$1,080~~ $853

完整複習 NLP - 圍繞 LLM 打造自然語言處理應用
~~$799~~ $631

超圖解 Python 程式設計 -- 從入門、網頁應用、YOLO 到生成式 AI 實作
~~$560~~ $442

秒懂 AI 輔助行動網頁設計：Visual Studio Code + GitHub Copilot + Bootstrap 5 + CSS3 + HTML5 + Web 專案實作
~~$760~~ $600

手把手帶你實作完整機器學習專案
~~$1,080~~ $853

Vibe Coding CLI 頂級開發 - Claude Code 前瞻菁英育成手冊
~~$880~~ $695

現代 AI 是這麼做出來的 - 從訓練、演算法到微調全實作
~~$980~~ $774

生成式 AI 開發實作｜使用 Transformers 與擴散模型 (Hands-On Generative AI with Transformers and Diffusion Models)
~~$920~~ $726

LLM 應用開發 - 業界最實用 30個應用現場直擊
~~$790~~ $624

Python 運算思維 : Google Colab x Gemini AI - 「零基礎」x「高效率」學「程式設計」
~~$720~~ $561

Grafana Zero to Hero：從視覺化到智慧監控，打造全知視角的可觀測性平台（iThome鐵人賽系列書）
~~$600~~ $450

程式人的第一本 Python 量化投資筆記：Colab 即時演練 × Backtrader 策略設計到績效評估全流程（iThome鐵人賽系列書）
~~$560~~ $442

白話人工智慧！矽谷科學家帶你看懂 AI 黑科技
~~$690~~ $455

AI 時代的 Side Project 全攻略：產品思維 × 專案管理 × 變現路徑（iThome鐵人賽系列書）
~~$1,250~~ $987

LLM 工程師開發手冊 (LLM Engineer's Handbook: Master the art of engineering large language models from concept to production)
~~$560~~ $442

零花費上手！Gemini 3 / NotebookLM / Nano Banana Pro / Veo 3.x 最強 AI 組合技，打造全能工作流
~~$690~~ $545

Vibe Coding 提示詞全攻略! 從概念到業界實戰：提示工程 / 程式碼維護 / Cursor / ChatGPT Codex / Lovable
~~$599~~ $473

最強！Google AI 工作術：以 Gemini 3 為核心，串聯 NotebookLM 與滿滿 AI 工具, 搞定資料分析、簡報製作、教育訓練等日常工作
~~$750~~ $592

Vibe Coding 聖經：4 天寫出 4000 行可執行程式碼，不只是「快」，也重新定義「你的能耐」！
~~$620~~ $489

NotebookLM 筆記術: 打造你的 AI「第二大腦」
~~$880~~ $695

n8n × Vibe Coding 本機 AI Agent 自動化工作流

開始學習 AI Agent & Vibe Coding 啦詳見活動內容 »

78折
~~$680~~ $530

人手一本的 Vibe Coding 資安實作課：不是專家也能自己動手與 AI 協作！從專案生成、攻防演練到資安框架一次學會！（OWASP Top 10 × ISO27001）
79折
$421

Cursor與Vibe Coding AI編成協同指南
79折
~~$880~~ $695

n8n × Vibe Coding 本機 AI Agent 自動化工作流
79折
$469

Vibe Coding氛圍編程實戰：普通人的AI編程入門書
79折
~~$580~~ $458

Vibe Coding 50 道零程式碼開發｜用 AI 打造生活與工作的應用程式 (Vibe Coding for Beginners: How to use AI and LLMs to create apps, websites and amazing technology without writing code)
79折
~~$680~~ $537

Vibe Coding - Python 超級入門 : ChatGPT x Codex
78折
~~$790~~ $616

不懂程式也能自架專屬 AI：Vibe Coding 教你從零開始本地部署與雲端整合
79折
~~$750~~ $592

Vibe Coding 聖經：4 天寫出 4000 行可執行程式碼，不只是「快」，也重新定義「你的能耐」！
79折
~~$780~~ $616

Cursor 2 Vibe Coding 開發手冊
79折
~~$850~~ $671

Claude Code Vibe Coding 開發手冊, 2/e
79折
~~$690~~ $545

Vibe Coding 提示詞全攻略! 從概念到業界實戰：提示工程 / 程式碼維護 / Cursor / ChatGPT Codex / Lovable
79折
$425

Vibe Coding：AI 編程時代的認知重構
79折
~~$1,080~~ $853

Vibe Coding CLI 頂級開發 - Claude Code 前瞻菁英育成手冊
79折
~~$880~~ $695

Vibe Coding - Cursor 教戰手冊
79折
~~$560~~ $442

AI 神助攻！程式設計新境界 – GitHub Copilot 開發 Python 如虎添翼 : 提示工程、問題分解、測試案例、除錯
79折
~~$599~~ $473

AI × SOP 生成式 AI 工作流：第一線 Prompt 驅動，打造企業 SOP
79折
~~$750~~ $592

Ollama 本地 AI 全方位攻略：命令列功能、五大主題測試、RAG、Vibe Coding、MCP，一本搞定所有實戰應用
79折
~~$750~~ $592

最強 AI 投資分析：打造自己的股市顧問機器人，股票趨勢分析 × 年報解讀 × 選股推薦 × 風險管理
79折
~~$980~~ $774

LLM × 網路爬蟲終極實戰：n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent
85折
$459

零基礎 AI 編程：Cursor 助力 Vibe Coding 實踐
79折
~~$750~~ $592

最強 AI 英語家教：TOEIC 高分實戰攻略
78折
~~$890~~ $694

AI Agent 實戰全攻略：Low-Code × 真落地，從地端部署到 RAG 設計，打造不被取代的核心競爭力（全書搭配 10 小時免費線上課程，讓你即戰力 UP！）
$594

教師智能體：巧用 AI Agent 高效工作
85折
$351

從零構建 AI Agent：大模型驅動的智能體設計與實戰
79折
~~$760~~ $600

AI Agent 智能工作流：設計與自動化全實戰

商品描述

內容介紹:

身處 LLM 時代的必備技能

AI 爬蟲與資料檢索的全本機工作流

你還在用傳統的方法爬取網路資料嗎？
還在手動分析 HTML 網頁結構、逐一定位網頁元素、再手刻爬蟲程式嗎？

身處 AI 世代，是時候該學習更聰明、更高效的資料收集方法，
讓你坐在電腦前，喝著咖啡、悠閒地看著 AI 為你自動爬取網路資料。

在 AI 飆速發展的今天，傳統網路爬蟲技術正迎來全新的變革。
過去，Python 爬蟲程式的開發者必須自行剖析 HTML 網頁結構，撰寫繁瑣複雜的資料擷取規則與步驟；如今，隨著 LLM 的普及，AI 已能協助我們理解 HTML 網頁結構、定位網頁資料，甚至能夠自動化建立整個爬取流程，大幅提升開發效率。

本書從 HTML 結構解析入門，循序講解 BeautifulSoup + CSS 選擇器、lxml + XPath 表達式、正規表達式等核心技術，再深入 Selenium 模擬瀏覽器互動及 Scrapy 爬蟲框架的專業應用，帶領讀者全面掌握靜態與動態網頁擷取技術。更進一步結合 Playwright 自動化瀏覽器、以及 AI 驅動的爬蟲框架 Crawl4AI 和 ScrapeGraphAI，讓 LLM 成為理解與提取網頁資料的主力。

不只如此，本書採用 n8n × Ollama 全本機架構，無需 API Key、無需 Docker，即可整合 SearXNG 搜尋引擎、Crawl4AI API 資料爬取、Qdrant 向量資料庫與 RAG 知識檢索生成，最終打造出 MCP + AI Agent 自動化流程 ⸺ 從搜尋、爬取到資料處理與知識生成一手包辦！

本書特色:

用 AI 分析 HTML 結構建立 Python 網路爬蟲
▸全面掌握靜態與動態 HTML 網頁擷取技術，CSS Selector、XPath 一次上手
▸實戰演練 BeautifulSoup、Selenium、Scrapy 經典 Python 爬蟲框架

Python × LLM 建立 AI 網路爬蟲
▸整合 OpenAI、Gemini、Groq、Ollama 等多種 LLM，打造智慧爬蟲系統
▸運用 AI 驅動的爬蟲技術 Crawl4AI 與 ScrapeGraphAI，自動理解並提取網頁內容
▸結合非同步程式設計，提升資料抓取效率與彈性

整合 Python × AI 網路爬蟲的 AI 工作流程：n8n
▸以視覺化介面建立自動化流程，輕鬆整合搜尋、爬取與資料處理
▸結合 Qdrant 向量資料庫 × RAG 技術，打造個人化知識檢索系統
▸構建全本機 AI Agent 工作流，實現從資料擷取到生成的自動化流程

作者簡介

作者簡介:

陳會安

學歷：美國猶他州州立大學電腦碩士
經歷：多所大專院校企業講師、松崗電腦產品經理、美商 PH 出版經理、專業電腦書作者

國內知名資訊技術作家，已出版逾 100 本電腦著作，包括：程式設計、網頁設計、資料庫、系統分析、資料結構等各種不同主題。近年研究人工智慧、機器學習 / 深度學習、資料科學、網路爬蟲、大數據分析和物聯網相關課程與圖書寫作，也熱衷利用 Raspberry Pi、Arduino、ESP8266 / ESP32 和 Micro:bit 等開發板製作創客作品，投入創客領域的教學與寫作。

目錄大綱

目錄:

▌第 1 章 HTML、JSON 與網路爬蟲的基礎
1-1 網路爬蟲的基礎
1-2 網路爬蟲的相關技術
1-3 HTML 標籤語法與結構
1-4 CSV 與 JSON
1-5 Python × AI 網路爬蟲的相關函式庫

▌第 2 章從網路取得資料
2-1 認識 HTTP 標頭與 httpbin.org 服務
2-2 使用 Requests 送出 HTTP 請求
2-3 取得 HTTP 回應內容
2-4 送出進階的 HTTP 請求
2-5 錯誤 / 例外處理與檔案存取

▌第 3 章擷取靜態 HTML 網頁資料
3-1 在 HTML 網頁定位目標資料
3-2 使用 BeautifulSoup 剖析 HTML 網頁
3-3 分析靜態 HTML 網頁
3-4 使用 find() 函式搜尋 HTML 網頁
3-5 使用正規表達式搜尋 HTML 網頁

▌第 4 章使用 CSS 選擇器爬取資料
4-1 認識 CSS 層級式樣式表
4-2 使用 CSS 選擇器定位 HTML 標籤
4-3 Google Chrome 開發人員工具
4-4 ChatGPT 應用：找出定位 HTML 標籤的 CSS 選擇器
4-5 在 BeautifulSoup 使用 CSS 選擇器

▌第 5 章走訪 HTML 網頁取出資料與資料儲存
5-1 如何走訪 HTML 網頁
5-2 走訪 HTML 網頁取得資料
5-3 修改 HTML 網頁來爬取資料
5-4 資料清理
5-5 將取得資料儲存成 CSV 和 JSON 檔案
5-6 從網路下載圖檔

▌第 6 章使用 XPath 表達式與 lxml 套件建立爬蟲程式
6-1 XPath 與 lxml 套件的基礎
6-2 使用 Requests 和 lxml 套件
6-3 XPath 資料模型
6-4 XPath 基本語法
6-5 XPath 運算子與函式
6-6 ChatGPT 應用：學習 XPath 表達式查詢 HTML 標籤

▌第 7 章 Selenium 表單互動與動態網頁擷取
7-1 認識動態網頁
7-2 安裝 Selenium
7-3 Selenium 的基本使用
7-4 定位網頁資料與例外處理
7-5 與 HTML 表單進行互動
7-6 JavaScript 動態網頁擷取

▌第 8 章 Scrapy 爬蟲框架
8-1 Scrapy 爬蟲框架的基礎
8-2 使用 Scrapy Shell
8-3 建立 Scrapy 專案的爬蟲程式
8-4 在專案使用 Item 和 Item Pipeline
8-5 輸出 Scrapy 爬取的資料

▌第 9 章 Python × ChatGPT 網路爬蟲
9-1 Python 爬蟲程式的常見問題
9-2 Requests + BeautifulSoup 爬蟲實作案例
9-3 Selenium 爬蟲實作案例
9-4 Scrapy 爬蟲實作案例

▌第 10 章在 Python 使用 LLM 大型語言模型
10-1 認識生成式 AI 與 LLM
10-2 使用 OpenAI 的 ChatGPT API
10-3 使用 Google 的 Gemini API
10-4 LLM API 服務：Groq API
10-5 使用 Ollama 打造本機 LLM

▌第 11 章 Python × AI 網路爬蟲（一）：非同步程式設計 + Crawl4AI
11-1 Python 非同步程式設計
11-2 Crawl4AI 的基本使用
11-3 內容篩選和客製化 Markdown 輸出
11-4 CSS 與 XPath 的 Schema 資料擷取
11-5 LLM 驅動的 AI 資料篩選與提取
11-6 深度爬取和 JavaScript 動態網頁處理

▌第 12 章 Python × AI 網路爬蟲（二）：ScrapeGraphAI
12-1 ScrapeGraphAI 簡介與環境設定
12-2 基礎 Graph：SmartScraperGraph 與 SmartScraperMultiGraph
12-3 文字轉語音 Graph：SpeechGraph
12-4 腳本生成 Graph：ScriptCreatorGraph 與 ScriptCreatorMultiGraph

▌第 13 章視覺化 AI 工作流程：n8n
13-1 認識 n8n 與工作流程
13-2 安裝與啟動 n8n 社群版
13-3 建立你的第 1 個工作流程
13-4 建立你的第 1 個 AI 工作流程
13-5 n8n 常用節點的使用

▌第 14 章爬取知識庫的資料：SearXNG + Crawl4AI API
14-1 安裝、啟動與使用 Crawl4AI API
14-2 使用 SearXNG API
14-3 爬取 RAG 所需的知識庫資料
14-4 在 n8n 建立爬蟲程式和使用 SearXNG + Crawl4AI API

▌第 15 章建立你自己的知識庫：Qdrant 向量資料庫
15-1 Embedding 模型：文字資料向量化
15-2 安裝與使用 Qdrant 向量資料庫
15-3 在 Python 程式使用 Qdrant 向量資料庫
15-4 建立你的知識庫：將文本內容存入向量資料庫
15-5 在 n8n 使用 Qdrant 向量資料庫

▌第 16 章打造你自己的客製化 LLM：AI Agent、MCP 與 RAG 系統
16-1 認識 AI Assistant、RAG、AI Agent 和 MCP
16-2 使用 Python 手把手打造本機 RAG 系統
16-3 n8n 的 AI Agent 與 Tool
16-4 n8n 的 AI Agent 與 MCP
16-5 在 n8n 建立 RAG 的客製化 LLM

▌附錄 A Python 開發環境：Anaconda 與 WinPython 客製化套件（電子書）
A-1 建立 Anaconda 的 Python 開發環境
A-2 安裝本書客製化的 WinPython 可攜式套件
A-3 使用 Thonny 的 Python IDE