文本數據管理與分析:信息檢索與文本挖掘的實用導論

[美] 翟成祥(Chengxiang Zhai) 肖恩·馬森(Sean Massung) 伊利諾伊大學香檳分校 著

買這商品的人也買了...

商品描述

本書是文本信息處理領域著名學者美國伊利諾伊大學香檳分校(University of Illinois at Urbana–Champaign,UIUC)翟成祥教授傾力之作,主要基於作者在UIUC講授數據管理與分析相關課程(如CS410文本信息系統,Text Information Systems)使用的材料。書中的大部分內容及結構與翟成祥教授在Coursera開設的兩門在線課程“文本檢索與搜索引擎”(Text Retrieval and Search Engines)和“文本挖掘與分析”(Text Mining and Analytics)一致,因此可作為兩門在線課程的主要參考書。
全書內容以文本數據處理為核心,從理論到實踐介紹了文本數據管理與分析的關鍵問題,廣泛涵蓋了信息檢索和文本挖掘相關技術。
本書具體內容:
·文本信息獲取與挖掘基礎:統計與概率論、信息論等相關理論和文本數據理解技術。
·文本信息獲取關鍵技術:信息檢索的模型、實現和評價,網絡搜索以及推薦系統等。
·文本挖掘關鍵技術:文檔分類,文檔聚類,文本摘要,主題分析,觀點挖掘與情感分析,文本與結構化數據聯合分析等。
·文本管理和分析系統:整合信息檢索與文本分析技術,結合配套軟件工具META,構建統一的、人機結合的文本管理和分析系統。
本書特點:
·內容深入淺出,理論實踐密切結合,可作為高等院校電腦科學或相關專業本科生、研究生信息檢索與文本挖掘課程的教材。
·主題豐富,體系完整,邏輯清晰,便於與各種課程體系結合,可作為高等院校相關專業教師的參考書。
·兼顧廣度與深度,覆蓋經典模型與方法並提供豐富的擴展閱讀文獻,可作為專業科研人員與工業界人士的參考書或技術手冊。