網絡數據採集技術——Java網絡爬蟲實戰

錢洋,薑元春

  • 出版商: 電子工業
  • 出版日期: 2020-01-01
  • 定價: $474
  • 售價: 8.8$417
  • 貴賓價: 8.5$403
  • 語言: 簡體中文
  • ISBN: 7121376075
  • ISBN-13: 9787121376078
  • 相關分類: 網路爬蟲 Web-crawler

立即出貨 (庫存 < 4)

買這商品的人也買了...

商品描述

本書以Java為開發語言,系統地介紹了網絡爬蟲的理論知識和基礎工具,包括網絡爬蟲涉及的Java基礎知識、HTTP協議基礎與網絡抓包、網頁內容獲取、網頁內容解析和網絡爬蟲數據存儲等。本書選取典型網站,採用案例講解的方式介紹網絡爬蟲中涉及的問題,以增強讀者的動手實踐能力。同時,本書還介紹了3種Java網絡爬蟲開源框架,即Crawler4j、WebCollector和WebMagic。本書適用於Java網絡爬蟲開發的初學者和進階者;也可作為網絡爬蟲課程教學的參考書,供高等院校文本挖掘、自然語言處理、大數據商務分析等相關學科的大學生和研究生參考使用;也可供企業網絡爬蟲開發人員參考使用。