文本機器學習
陳小青 黎琳 潘微.
- 出版商: 機械工業
- 出版日期: 2026-01-01
- 售價: $954
- 語言: 簡體中文
- ISBN: 7111792777
- ISBN-13: 9787111792772
-
相關分類:
Text-mining
- 此書翻譯自: Machine Learning for Text
下單後立即進貨 (約4週~6週)
相關主題
商品描述
本書構建了條理清晰的文本分析框架,該框架系統整合了信息檢索、機器學習和自然語言處理的交叉主題,尤其側重深度學習方法的應用,助力讀者形成從基礎到前沿的完整認知體系。全書可分為三大部分,具體如下:基本算法(第1章至第7章):聚焦於文本分析領域的經典算法,深入探討預處理、相似度計算、主題建模、矩陣分解、聚類、分類、回歸以及集成分析等關鍵技術。這些算法作為文本分析的基石,為後續 覆雜的應用奠定了堅實基礎。領域敏感學習與信息檢索(第8章和第9章):圍繞異構環境下的學習模型展開,詳細探討如何將文本與多媒體、網絡鏈接等多元數據進行有機結合。同時,從排序和機器學習方法的獨特視角,深入剖析信息檢索與網絡搜索所面臨的挑戰。自然語言處理( 0章至 6章):討論各類以序列為中心的應用和自然語言處理的前沿技術,包括特征工程、自然語言模型、深度學習、Transformer架構、預訓練語言模型、文本摘要、信息提取、知識圖譜構建、問答系統設計、意見挖掘、文本分割和事件檢測等。
作者簡介
查魯·C. 阿加沃爾(Charu C. Aggarwal)<br />紐約約克敦高地IBM T. J. 沃森研究中心的傑出研究員(DRSM)。他1993年畢業於印度坎普爾理工學院,獲計算機科學學士學位,1996年獲麻省理工學院運籌學博士學位。他在經過同行評審的會議和期刊上發表了400多篇論文,申請或獲得的專利超過80項。他撰寫或編輯了20部著作,包括線性代數、機器學習(文本領域)、神經網絡、 系統和異常值分析等領域的教科書。由於其專利的商業價值,他曾三次被IBM授予“傑出發明家”稱號。他獲得過多項內部和外部獎項,包括EDBT時間考驗獎(2014年)、ACM SIGKDD 創新獎(2019年)和IEEE ICDM研究貢獻獎(2015年)。他還是W. 華萊士·麥克道威爾獎的獲得者,該獎項是IEEE計算機學會在計算機科學領域頒發的 技術榮譽。<br />他曾擔任ACM SIGKDD Explorations主編,目前擔任ACM Transactions on Knowledge Discovery from Data和ACM Books主編。他因“在知識發現和數據挖掘算法方面的貢獻”當選為工業與應用數學學會(SIAM)、美國計算機協會(ACM)和電氣與電子工程師協會(IEEE)會士。
