Python自然語言處理 Python自然语言处理

伯德 (Steven Bird), 克萊恩 (Ewan Klein), 洛佩爾 (Edward Loper)

立即出貨

買這商品的人也買了...

商品描述

<內容簡介>

自然語言處理(Natural Language Processing,NLP)是電腦科學領域與人工智能領域中的一個重要方向。它研究能夠實現人與電腦之間用自然語言進行有效通信的各種理論和方法,涉及所有用電腦對自然語言進行的操作。
    伯德、克萊恩、洛佩爾編著的這本《Python自然語言處理》是自然語言處理領域的一本實用入門指南,旨在幫助讀者學習如何編寫程序來分析書面語言。《Python自然語言處理》基於Python編程語言以及一個名為NLTK的自然語言工具包的開源庫,但並不要求讀者有Python編程的經驗。全書共11章,按照難易程度順序編排。第1章到第3章介紹了語言處理的基礎,講述如何使用小的Python程序分析感興趣的文本信息。第4章討論結構化程序設計,以鞏固前面幾章中介紹的編程要點。第5章到第7章介紹語言處理的基本原理,包括標註、分類和信息提取等。第8章到第10章介紹了句子解析、句法結構識別和句意表達方法。第11章介紹瞭如何有效管理語言數據。後記部分簡要討論了NLP領域的過去和未來。
    《Python自然語言處理》的實踐性很強,包括上百個實際可用的例子和分級練習。《Python自然語言處理》可供讀者用於自學,也可以作為自然語言處理或計算語言學課程的教科書,還可以作為人工智能、文本挖掘、語料庫語言學等課程的補充讀物。

<目錄>

第1章  語言處理與Python
  1.1  語言計算:文本和詞匯
  1.2  近觀Python:將文本當做詞鏈表
  1.3  計算語言:簡單的統計
  1.4  回到Python:決策與控制
  1.5  自動理解自然語言
  1.6  小結
  1.7  深入閱讀
  1.8  練習
第2章  獲得文本語料和詞匯資源
  2.1  獲取文本語料庫
  2.2  條件頻率分佈
  2.3  更多關於Python:代碼重用
  2.4  詞典資源
  2.5  WordNet
  2.6  小結
  2.7  深入閱讀
  2.8  練習
第3章  處理原始文本
  3.1  從網絡和硬盤訪問文本
  3.2  字符串:最底層的文本處理
  3.3  使用Unicode進行文字處理
  3.4  使用正則表達式檢測詞組搭配
  3.5  正則表達式的有益應用
  3.6  規範化文本
  3.7  用正則表達式為文本分詞
  3.8  分割
  3.9  格式化:從鏈表到字符串
  3.10  小結
  3.11  深入閱讀
  3.12  練習
第4章  編寫結構化程序
  4.1  回到基礎
  4.2  序列
  4.3  風格的問題
  4.4  函數:結構化編程的基礎
  4.5  更多關於函數
  4.6  程序開發
  4.7  演算法設計
  4.8  Python庫的樣例
  4.9  小結
  4.10  深入閱讀
  4.11  練習
第5章  分類和標註詞匯
  5.1  使用詞性標註器
  5.2  標註語料庫
  5.3  使用Python字典映射詞及其屬性
  5.4  自動標註
  5.5  N-gram標註
  5.6  基於轉換的標註
  5.7  如何確定一個詞的分類
  5.8  小結
  5.9  深入閱讀
  5.10  練習
第6章  學習分類文本
  6.1  監督式分類
  6.2  監督式分類的舉例
  6.3  評估
  6.4  決策樹
  6.5  樸素貝葉斯分類器
  6.6  最大熵分類器
  6.7  為語言模式建模
  6.8  小結
  6.9  深入閱讀
  6.10  練習
第7章  從文本提取信息
  7.1  信息提取
  7.2  分塊
  7.3  開發和評估分塊器
  7.4  語言結構中的遞歸
  7.5  命名實體識別
  7.6  關係抽取
  7.7  小結
  7.8  深入閱讀
  7.9  練習
第8章  分析句子結構
  8.1  一些語法困境
  8.2  文法的用途
  8.3  上下文無關文法
  8.4  上下文無關文法分析
  8.5  依存關係和依存文法
  8.6  文法開發
  8.7  小結
  8.8  深入閱讀
  8.9  練習
第9章  建立基於特徵的文法
  9.1  文法特徵
  9.2  處理特徵結構
  9.3  擴展基於特徵的文法
  9.4  小結
  9.5  深入閱讀
  9.6  練習
第10章  分析語句的含義
  10.1  自然語言理解
  10.2  命題邏輯
  10.3  一階邏輯
  10.4  英語語句的語義
  10.5  段落語義層
  10.6  小結
  10.7  深入閱讀
  10.8  練習
第11章  語言數據管理
  11.1  語料庫結構:案例研究
  11.2  語料庫生命周期
  11.3  數據採集
  11.4  使用XML
  11.5  使用Toolbox數據
  11.6  使用OLAC元數據描述語言資源
  11.7  小結
  11.8  深入閱讀
  11.9  練習
後記
參考文獻