Python 網路爬蟲與資料視覺化應用實務
陳允傑
- 出版商: 旗標
- 出版日期: 2018-12-28
- 定價: $650
- 售價: 8.5 折 $553
- 語言: 繁體中文
- 頁數: 640
- ISBN: 9863125628
- ISBN-13: 9789863125624
-
相關分類:
Web-crawler 網路爬蟲、Data-visualization
已絕版
買這商品的人也買了...
-
Deep Learning|用 Python 進行深度學習的基礎理論實作$580$458 -
演算法圖鑑:26種演算法 + 7種資料結構,人工智慧、數據分析、邏輯思考的原理和應用 step by step 全圖解$450$356 -
為你自己學 Git$500$425 -
金融科技實戰:Python 與量化投資$650$507 -
自然語言處理:用人工智慧看懂中文$690$587 -
給工程師的第一本理財書:程式金融交易的 118個入門關鍵技巧$500$390 -
Python 資料科學與人工智慧應用實務$650$553 -
Python 新手使用 Django 架站技術實作:活用 Django 2.0 Web Framework 建構動態網站的 16堂課$690$538 -
Python 大數據特訓班:資料自動化收集、整理、分析、儲存與應用實戰 (附近300分鐘影音教學/範例程式)$450$356 -
Python 網路爬蟲與資料分析入門實戰$450$351 -
網站擷取|使用 Python, 2/e (Web Scraping with Python: Collecting More Data from the Modern Web, 2/e)$580$458 -
PyTorch 深度學習與自然語言中文處理$420$328 -
Python 技術者們 - 實踐! 帶你一步一腳印由初學到精通$650$553 -
圖解 Linux 核心工作原理|透過實作與圖解學習OS與硬體的基礎知識$450$356 -
簡潔的 Python|重構你的舊程式 (Clean Code in Python: Refactor your legacy codebase)$480$408 -
Python:股票演算法交易實務 145個關鍵技巧詳解$500$390 -
不懂程式也能學會的大數據分析術 - 使用 RapidMiner$550$468 -
Python 駭客密碼|加密、解密與破解實例應用 Cracking Codes with Python$520$442 -
Python 最強入門邁向數據科學之路 -- 王者歸來 (火力加強版)$799$559 -
Deep learning 深度學習必讀 - Keras 大神帶你用 Python 實作 (Deep Learning with Python)$1,000$790 -
超圖解 Python 程式設計入門$650$553 -
Python 最強入門邁向頂尖高手之路 -- 王者歸來 (全彩版)$1,000$790 -
Pandas 資料分析實戰:使用 Python 進行高效能資料處理及分析 (Learning pandas : High-performance data manipulation and analysis in Python, 2/e)$580$493 -
Python 技術者們 - 練功!老手帶路教你精通正宗 Python 程式 (The Quick Python Book, 3/e)$780$663 -
Python 網路爬蟲:大數據擷取、清洗、儲存與分析 -- 王者歸來$650$514
商品描述
【大數據時代必備的資料擷取與分析技能!】
在資訊爆炸的時代,網路就是一個龐大的資源庫,不論是「想找出最便宜的商品價格」、「想知道競爭者的商品資訊」、「分析時下流行的趨勢」、「想了解歷史股價」、「分析球員的打擊率、得分率」、「分析點閱率最高的影片做為行銷決策」、……等等,都可以輕易取得各種數據。
雖然數據來源不是問題,但要抓取、整理、分析龐大的資料,就需要一些工具及方法才能有效率地完成。本書實際教您使用 Python 的 Beautiful Soup、Pandas、Selenium 及 Scrapy 來建立爬蟲程式,並依不同的網頁型態使用對應的工具來抓取資料。在取得和儲存資料後,教您利用 Python的Matplotlib、Pandas、SeaBorn、Bokeh,將資料以視覺化的方式呈現,讓決策者能快速理解資料的【模式】、【趨勢】和【關聯性】。
本書特色 :
※從網路爬蟲→資料清理→資料視覺化,有效率地完成資料的探索及呈現。
※清楚解說 Python 各套件的使用時機
.【擷取靜態網頁資料】-CSS 選擇器+Beautiful Soup 及 lxml
.【擷取 Javascript 動態網頁資料】-Selenium
.【擷取整個網站資料】-Scrapy 框架
.【資料視覺化】-Matplotlib、Pandas、Seaborn、Bokeh
※列舉多項實例,讓您應用所學,實際擷取資料
.用 Beautiful Soup 爬取股價、電影、圖書等資訊
.用 Selenium 爬取旅館、食譜資訊
.用 Scrapy 爬取 Tutsplus 教學文件及 PTT 看板資訊
目錄大綱
目錄 :
【Part 1 建立 Python 爬蟲程式 - 從網頁取得資料】
CHAPTER 1 HTML、JSON 與網路爬蟲的基礎
CHAPTER 2 從網路取得資料
CHAPTER 3 擷取靜態 HTML 網頁資料
CHAPTER 4 使用 CSS 選擇器爬取資料
CHAPTER 5 走訪 HTML 網頁取出資料與資料儲存
CHAPTER 6 使用 XPath 運算式與 lxml 套件建立爬蟲程式
CHAPTER 7 Selenium 表單互動與動態網頁擷取
CHAPTER 8 Scrapy 爬蟲框架
CHAPTER 9 Python 爬蟲程式實作案例
CHAPTER 10 將爬取資料存入 MySQL 資料庫
【Part 2 Python 資料視覺化 - 大數據分析】
CHAPTER 11 認識大數據分析-資料視覺化
CHAPTER 12 使用 Pandas 掌握你的資料
CHAPTER 13 Matplotlib 與 Pandas 資料視覺化
CHAPTER 14 Seaborn 統計資料視覺化
CHAPTER 15 Bokeh 互動圖表與儀表板
CHAPTER 16 Python 資料視覺化實作案例
附錄 A Python 程式語言與開發環境建立









