Tika in Action (Paperback)

Chris Mattmann, Jukka Zitting

  • 出版商: Manning
  • 出版日期: 2011-12-11
  • 定價: $1,480
  • 售價: 6.0$888
  • 語言: 英文
  • 頁數: 256
  • 裝訂: Paperback
  • ISBN: 1935182854
  • ISBN-13: 9781935182856
  • 相關分類: 大數據 Big-dataData Science
  • 立即出貨 (庫存=1)

買這商品的人也買了...

相關主題

商品描述

The information trapped in text files, PDFs, and other digital content is a valuable information asset that can be very difficult to discover and use. Apache Tika is an open source toolkit that makes it easy for search engines, content management systems and other applications to detect and extract content from digital documents in all major file formats.

Tika in Action is a hands-on guide for developers working with search engines, content management systems and other similar applications who want to exploit the information locked in digital documents. It introduces the world of mining text and binary documents as well as other information sources. The book shows where Tika fits within this landscape and how readers can use Tika to build and extend applications. The book's many case studies give real-world experience from domains ranging from search engines to digital asset management and scientific data processing.

商品描述(中文翻譯)

數位檔案中所包含的資訊,如文字檔案、PDF和其他數位內容,是一項有價值的資訊資產,但往往很難發現和使用。Apache Tika是一個開源工具包,可讓搜尋引擎、內容管理系統和其他應用程式輕鬆地從各種主要檔案格式中偵測和提取數位文件的內容。

《Tika in Action》是一本實用指南,針對與搜尋引擎、內容管理系統和其他類似應用程式一起工作的開發人員,希望利用數位文件中鎖定的資訊。本書介紹了文字和二進位文件以及其他資訊來源的探勘世界。書中展示了Tika在這個領域中的定位,以及讀者如何使用Tika來建立和擴展應用程式。書中的許多案例研究提供了來自各個領域的實際經驗,範圍從搜尋引擎到數位資產管理和科學資料處理。