基於 Python 的智能文本分析 (Applied Text Analysis with Python: Enabling Language-Aware Data Products with Machine Learning)
Benjamin Bengfort; Rebecca Bilbro; Tony Ojeda 陳光
- 出版商: 中國電力
- 出版日期: 2019-12-01
- 定價: $528
- 售價: 7.9 折 $417
- 語言: 簡體中文
- 頁數: 328
- 裝訂: 平裝
- ISBN: 7519838293
- ISBN-13: 9787519838294
-
相關分類:
Python、Text-mining、Machine Learning
- 此書翻譯自: Applied Text Analysis with Python: Enabling Language-Aware Data Products with Machine Learning
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
機率與統計 (Walpole: Essentials of Probability & Statistics for Engineers & Scientists)$680$666 -
$352Python 自然語言處理實戰:核心技術與算法 -
特徵工程不再難:資料科學新手也能輕鬆搞定! (Feature Engineering Made Easy: Identify unique features from your dataset in order to build powerful machine learning systems)$520$406 -
$322從統計世界走向人工智能 -- 實戰案例與算法 -
$469機器學習實踐:數據科學應用與工作流的開發及優化 -
$658文本機器學習
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
VIP 95折
深入淺出 SSD 測試 : 固態存儲測試流程 方法與工具$594$564 -
VIP 95折
MCP 開發從入門到實戰$515$489 -
85折
$806Linux x64 匯編語言編程 -
87折
$417MCP 極簡開發 : 輕鬆打造高效智能體 -
VIP 95折
RISC-V 架構 DSP 處理器設計$534$507 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
85折
$454RAG 實踐權威指南:構建精準、高效大模型之道 -
87折
$621CUDA 並行編程與性能優化 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
VIP 95折
大模型驅動的具身智能 架構,設計與實現$534$507 -
VIP 95折
納米級CMOS VLSI電路(可制造性設計)$474$450 -
VIP 95折
Manus應用與AI Agent設計指南:從入門到精通$359$341 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
VIP 95折
芯片的較量 (日美半導體風雲)$414$393 -
VIP 95折
Manus AI 智能體從入門到精通$294$279 -
87折
$981深度學習:基礎與概念 -
79折
$469GitHub Copilot 編程指南 -
79折
$425Cursor 與 Copilot 開發實戰 : 讓煩瑣編程智能化 -
79折
$512C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
Verilog HDL計算機網絡典型電路算法設計與實現$354$336 -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
VIP 95折
深入淺出 SSD 測試 : 固態存儲測試流程 方法與工具$594$564 -
VIP 95折
MCP 開發從入門到實戰$515$489 -
85折
$806Linux x64 匯編語言編程 -
87折
$417MCP 極簡開發 : 輕鬆打造高效智能體 -
VIP 95折
RISC-V 架構 DSP 處理器設計$534$507 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
85折
$454RAG 實踐權威指南:構建精準、高效大模型之道 -
87折
$621CUDA 並行編程與性能優化 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
VIP 95折
大模型驅動的具身智能 架構,設計與實現$534$507 -
VIP 95折
納米級CMOS VLSI電路(可制造性設計)$474$450 -
VIP 95折
Manus應用與AI Agent設計指南:從入門到精通$359$341 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
VIP 95折
芯片的較量 (日美半導體風雲)$414$393 -
VIP 95折
Manus AI 智能體從入門到精通$294$279 -
87折
$981深度學習:基礎與概念 -
79折
$469GitHub Copilot 編程指南 -
79折
$425Cursor 與 Copilot 開發實戰 : 讓煩瑣編程智能化 -
79折
$512C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
Verilog HDL計算機網絡典型電路算法設計與實現$354$336 -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673
相關主題
商品描述
從新聞、講話,到社交媒體上非正式的聊天,自然語言是最豐富、且尚未充分利用的數據源之一。
不但數據源源不斷,在使用環境中還在不斷調整、變化;還包含了很多傳統數據源未能傳達的信息。
打開自然語言寶藏的鑰匙,就是基於文本分析的創造性應用。
這本實戰指南介紹了從數據科學家角度如何建立語言感知產品並有效應用機器學習。
您將學到如何用Python實現健壯、可重複和可擴展的文本分析,
包括上下文特徵和語言特徵工程、向量化、分類、主題建模、實體解析、圖分析和可視化操作。
在本書的最後,您將獲得解決眾多複雜現實問題的實用方法。
預處理並將文本向量化成高維特徵表示。執行文檔分類和主題建模。
通過可視化診斷指導模型選擇過程。提取關鍵短語、命名實體和圖結構,實現文本數據推斷。
建立對話框架,實現聊天機器人和語言驅動交互。
用Spark擴展處理能力,用神經網絡實現對更複雜模型的支持。
作者簡介
Benjamin Bengfort
是一位專門研究分佈式系統、機器學習及其他相關技術的計算機科學家。
Rebecca Bilbro
是一名數據科學家和Python程序員,致力於研究機器學習工作流的可視化診斷。
Tony Ojeda
是District Data Labs的創始人和CEO,專註於商業策略應用分析、優化、預測服務,以及開源工具使用課程。
陳光
北京郵電大學副教授,主要研究方向為機器學習和自然語言處理。
目錄大綱
前言
第1章語言與計算
數據科學範式
語言感知數據產品
語言即數據
小結
第2章構建自定義語料庫
語料庫是什麼?
語料庫數據管理
語料庫讀取器
小結
第3章語料庫預處理與處置
分解文檔
語料庫的轉換
小結
第4章文本向量化和轉換流水線
空間中的詞
Scikit-Learn API
流水線
小結
第5章面向文本分析的文本分類
文本分類
構建文本分類應用
小結
第6章文本相似性聚類
文本上的無監督學習
文檔相似性聚類
文檔主題建模
小結
第7章上下文感知文本分析
基於語法的特徵提取
n-Gram特徵提取
n- Gram語言模型
小結
第8章文本可視化
可視化特徵空間
模型診斷
可視化操縱
小結
第9章文本的圖分析
圖計算與分析
從文本中抽取圖
實體解析
小結
第10章聊天機器人
對話基礎
禮貌對話規則
有趣的問題
學習幫助
小結
第11章利用多處理和Spark擴展文本分析
Python多處理
Spark集群計算
小結
第12章深度學習與未來
應用神經網絡
神經網絡語言模型
情感分析
未來(幾乎)已來
詞彙表
