Python 網路爬蟲與資料分析入門實戰
林俊瑋、林修博
- 出版商: 博碩
- 出版日期: 2018-10-04
- 定價: $450
- 售價: 7.8 折 $351
- 語言: 繁體中文
- 頁數: 256
- ISBN: 9864343386
- ISBN-13: 9789864343386
-
相關分類:
Web-crawler 網路爬蟲
銷售排行:
🥈 2018/11 繁體中文書 銷售排行 第 2 名
🥇 2018/10 繁體中文書 銷售排行 第 1 名
立即出貨(限量) (庫存=4)
買這商品的人也買了...
-
精通 Python|運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)$780$616 -
Python 自動化的樂趣|搞定重複瑣碎 & 單調無聊的工作 (中文版) (Automate the Boring Stuff with Python: Practical Programming for Total Beginners)$500$425 -
TensorFlow + Keras 深度學習人工智慧實務應用$590$460 -
寫程式前就該懂的演算法 ─ 資料分析與程式設計人員必學的邏輯思考術 (Grokking Algorithms: An illustrated guide for programmers and other curious people)$390$308 -
Docker 這樣學才有趣:從入門,到玩直播、挖礦$450$356 -
演算法圖鑑:26種演算法 + 7種資料結構,人工智慧、數據分析、邏輯思考的原理和應用 step by step 全圖解$450$356 -
為你自己學 Git$500$425 -
Python 入門邁向高手之路王者歸來$699$594 -
無瑕的程式碼-整潔的軟體設計與架構篇 (Clean Architecture: A Craftsman's Guide to Software Structure and Design)$580$452 -
給工程師的第一本理財書:程式金融交易的 118個入門關鍵技巧$500$390 -
Python 神乎其技:精要剖析語法精髓,大幅提升程式功力!$520$442 -
Python 大數據特訓班:資料自動化收集、整理、分析、儲存與應用實戰 (附近300分鐘影音教學/範例程式)$450$356 -
提升程式設計師的面試力|189道面試題目與解答, 6/e (Cracking the Coding Interview : 189 Programming Questions and Solutions, 6/e)$880$748 -
Python 機器學習, 2/e (Python Machine Learning, 2/e)$690$538 -
練好機器學習的基本功|用 Python 進行基礎數學理論的實作$450$383 -
Python 資料分析, 2/e (Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2/e)$880$695 -
網站擷取|使用 Python, 2/e (Web Scraping with Python: Collecting More Data from the Modern Web, 2/e)$580$458 -
類神經網路實戰:使用 Python (Make Your Own Neural Network)$420$328 -
一次搞懂熱門前端框架 - React、Vue.js、Angular、Backbone.js、Aurelia$620$527 -
CODE COMPLETE:軟體開發實務指南, 2/e (中文版) (Code Complete: A Practical Handbook of Software Construction, 2/e)$1,280$998 -
Attacking Network Protocols|王牌駭客的網路攻防手法大公開 (Attacking Network Protocols: A Hacker's Guide to Capture, Analysis, and Exploitation)$480$408 -
Python 網路爬蟲與資料視覺化應用實務$650$553 -
深度學習入門教室:6堂基礎課程 + Python 實作練習,Deep Learning、人工智慧、機器學習的理論和應用全圖解$550$495 -
Python:股票演算法交易實務 145個關鍵技巧詳解$500$390 -
Python 網路爬蟲:大數據擷取、清洗、儲存與分析 -- 王者歸來$650$514
超有料 AI 工作術 2書75折 詳見活動內容 »
-
79折
AI 加持!Google Sheets 超級工作流$599$473 -
79折
最強 AI 組合技!NotebookLM / Gemini / Nano Banana / Veo 3 【影音生成進化版】$499$394 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
AI 超神筆記術:NotebookLM 高效資料整理與分析 250技$480$379 -
79折
AI 提問 X 學習 X 應用:ChatGPT、NotebookLM、Gemini、GitHub Copilot從零到完全實戰$390$308 -
79折
NVIDIA 輝達之道:第一本輝達詳解!從 AI 教父黃仁勳的登頂之路,看全球科技投資前景$450$356 -
79折
AI 工具使用手冊:學會 AI 魔法讓你變身超人不再當麻瓜, 2/e$690$545 -
79折
AI 超神活用術:Felo 搜尋、筆記、簡報、網頁、知識庫、心智圖與視覺圖表全能助手$490$387 -
79折
AI 時代的 Python 高效學習書 - ChatGPT 程式助理新思維$550$435 -
79折
圖像生成 AI Stable Diffusion 實作技法書:從設定、生成到調整,全面掌握 AI 繪圖實戰技!$550$435 -
79折
邊緣 AI - 使用 NVIDIA Jetson Orin Nano 開發具備深度學習、電腦視覺與生成式 AI 功能的 ROS2 機器人$580$458 -
79折
手機感測器也上 AI – 人工智慧邊緣運算實作開發教戰手冊$1,080$853 -
78折
重構:改善 .NET 與 C# 應用程式的設計,償還欠下的技術債 (使用 GitHub Copilot 與 Visual Studio) (Refactoring with C#: Safely improve .NET applications and pay down technical debt with Visual Studio, .NET 8, and C# 12)$850$663 -
78折
AI × Excel × Tableau 資料分析語法指南$680$530 -
79折
ChatGPT 開發手冊 Turbo × Vision 進化版 — 用 OpenAI Chat/Assistants API‧Function calling 設計 GPTs action‧LINE/Discord bot‧股市分析/自動助理$820$648 -
78折
AIGC 全能實作教科書:一次學會 ChatGPT、簡報、設計與影音繪圖,打造你的 AI 創作工作術$680$530 -
79折
Canva + AI 創意設計與品牌應用 300招:從商業技巧、社群祕技到AI圖文影音特效, 2/e$560$442 -
78折
ChatGPT × Ionic × Angular 全方位技術整合實戰:輕鬆打造跨平台 AI 英語口說導師 APP(iThome鐵人賽系列書)$680$530 -
79折
人人都會 AI 繪圖:開啟斜槓人生金鑰匙,2000件生成作品 + 完整提示詞(全書中英文提示詞,立即下載使用)$780$616 -
78折
資安密碼-隱形帝國:AI數位鑑識、社交工程攻防與現代密碼技術實戰$550$429 -
79折
AI 繪圖邁向視覺設計$720$569 -
79折
圖解雲端運算|概念、技術、安全與架構, 2/e$760$600 -
79折
敏捷開發實踐指南|讓團隊取得亮麗成果$550$435 -
79折
Python X ChatGPT:零基礎 AI 聊天用流程圖學 Python 程式設計$490$387 -
79折
LLM 串接所有服務 - LangChain 原型到產品全面開發$680$537
相關主題
商品描述
想自動化生活瑣事?想透過程式擷取網路上的公開資訊?學了Python卻不知道有什麼實際應用?正在尋找入門難度低且成就感高的Python專案?想知道網路爬蟲如何與資料分析結合?本書一次教給你!
本書特色:
● 基於熱門線上課程與實體教學的學員迴響重新編寫及增補而成的實戰書籍
● 以台灣讀者熟悉的網站為範例(PTT、Dcard、台灣證交所、蘋果日報網站、Yahoo奇摩電影、Google Maps API、IMDB電影資料庫等)的Python網路爬蟲程式教學
● 由淺入深,以實務需求為導向,涵蓋爬蟲常用函式庫、資料儲存、文件編碼、表單及登入頁處理、爬蟲程式被封鎖的常見原因等經驗談
● 全新的資料分析章節,包含三個爬蟲程式的經典應用:量化投資、影評情緒分析與商品特價通知
本書適合閱讀的對象:
● 對網路爬蟲程式或資料分析有興趣者
● 想自動化生活瑣事(例如自動追蹤網站特價通知、節省資料收集的時間等),化被動資訊接收為主動
● Python新手或入門級讀者(知道何謂變數、if 判斷式與迴圈,寫過一些小程式),想練習低門檻及高成就感的Python專案
作者簡介
林俊瑋
熱門開源專案「PTT網路版爬蟲」作者。加州大學爾灣分校(UC Irvine)博士候選人,研究領域為軟體測試自動化,曾執行包含網頁及手機 App 爬蟲實作的多個研究專案,也曾在國外知名研究機構及國內軟體公司實習,並有多年政府資訊部門工作與介接政府開放資料經驗。
林修博
台灣大學電子工程研究所畢業,目前任職於軟體公司擔任全端工程師。有多年爬蟲撰寫經驗,並且將其商用化。
目錄大綱
Chapter 01 環境設定與網頁爬蟲初探
1-1 環境設定及套件安裝:Anaconda
1-2 使用IDE:PyCharm
1-3 使用Jupyter Notebook
1-4 網頁文件解構與網頁爬蟲初探
Chapter 02 Beautiful Soup 講解與網頁解構
2-1 不要重複造輪子:寫爬蟲之前
2-2 Beautiful Soup 重要功能 (find(), find_all(), .text, .stripped_strings)
2-3 網頁結構巡覽(parent, children, siblings)
2-4 正規表示式 (Regular Expression)
Chapter 03 網頁爬蟲範例實戰
3-1 PTT 八卦板今日熱門文章
3-2 Yahoo 奇摩電影本週新片
3-3 兩大報當日焦點新聞
3-4 Google 搜尋股價資訊
3-5 Dcard 今日熱門文章
Chapter 04 使用 API
4-1 API 簡介
4-2 PTT 八卦板眾來源分佈 (ipstack.com)
4-3 IMDB API
4-4 Google Maps APIs (Google Geocoding/Places API)
4-5 Dcard API
Chapter0 5 資料儲存
5-1 儲存圖片與多媒體檔案
5-2 儲存資料到 CSV 檔
5-3 儲存資料到資料庫 SQLite
Chapter 06 不同編碼與類型的文件
6-1 非 UTF-8 編碼的文件
6-2 XML 文件
Chapter 07 進階爬蟲議題
7-1 處理表單及登入頁 :台灣高鐵時刻查詢
7-2 處理表單及登入頁 :Yelp 登入
7-3 使用WebDriver:台銀法拍屋資訊查詢
7-4 爬蟲程式經驗談:被封鎖的常見原因、常用 Header 欄位、網站隱藏欄位、使用代理伺服器
Chapter 08 資料分析實戰
8-1 台股每日盤後資訊爬蟲及策略回測(量化投資)
8-2 電影評論情緒分析(中文自然語言處理與機器學習)
8-3 商品特價 Gmail 通知:Costco 商品網頁
附表 本書範例目標網站列表
附錄A 在 Mac 安裝Anaconda 開發環境
附錄B Python 爬蟲框架Scrapy 入門教學
B-1 Scrapy 環境安裝
B-2 簡易部落格爬蟲
B-3 Scrapy 系統架構
















