神經網絡機器翻譯技術及產業應用
王海峰, 何中軍, 吳華編著
- 出版商: 機械工業
- 出版日期: 2023-04-01
- 定價: $534
- 售價: 7.9 折 $422
- 語言: 簡體中文
- 頁數: 300
- 裝訂: 平裝
- ISBN: 7111725204
- ISBN-13: 9787111725206
-
相關分類:
Natural Language Processing
立即出貨 (庫存 < 4)
買這商品的人也買了...
-
一讀就懂!太陽能發電系統詳解$400$360 -
$659神經機器翻譯 -
AI 提示工程師的 16堂關鍵必修課:精準提問 x 優化提示 x 有效查詢 x 文字生成 x AI繪圖$620$484 -
$422自然語言處理與應用 -
聰明提問 AI 的技巧與實例:ChatGPT、Bing Chat、AgentGPT、AI繪圖,一次滿足$650$507 -
$473ChatGPT原理與應用開發 簽名版 -
LLM 大型語言模型的絕世祕笈:27路獨步劍法,帶你闖蕩生成式 AI 的五湖四海 (iThome鐵人賽系列書)$650$507 -
$414大語言模型通識 -
$284大語言模型基礎(微課視頻版) -
$301自然語言處理——基於深度學習的理論和實踐(微課視頻版) -
AI 讀心數 - 推薦系統演算法核心程式碼精通$780$616 -
$602智能供應鏈:運籌優化理論與實戰 -
$422LangChain 大模型 AI 應用開發實踐 -
生成式 AI 實戰基於 Transformer、Stable Diffusion、LangChain 和 AI Agent$479$455 -
LLM 核心攻略制霸生成式 AI:ChatGPT、嵌入技術、微調與多模態 AI 最佳實踐$680$537 -
語音識別:原理與應用, 3/e$714$678 -
生成式人工智能(教師應用指南)$408$388 -
多模態大模型:從理論到實踐$594$564 -
$332大模型應用開發極簡入門(基於DeepSeek雙色版) -
5G+智慧教育$414$393 -
$378深入淺出人工智能 — 原理、技術與應用 -
深度學習最佳入門與專題實戰:自然語言處理、大型語言模型與強化學習篇$880$695 -
$374大語言模型極速入門:技術與應用 -
大模型核心技術與應用 (微課視頻版)$474$450 -
AI 工程|從基礎模型建構應用 (AI Engineering : Building Applications with Foundation Models)$1,200$948
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
VIP 95折
深入淺出 SSD 測試 : 固態存儲測試流程 方法與工具$594$564 -
VIP 95折
MCP 開發從入門到實戰$515$489 -
85折
$806Linux x64 匯編語言編程 -
VIP 95折
MCP 極簡開發 : 輕鬆打造高效智能體$479$455 -
VIP 95折
RISC-V 架構 DSP 處理器設計$534$507 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
85折
$454RAG 實踐權威指南:構建精準、高效大模型之道 -
VIP 95折
CUDA 並行編程與性能優化$714$678 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
VIP 95折
大模型驅動的具身智能 架構,設計與實現$534$507 -
VIP 95折
納米級CMOS VLSI電路(可制造性設計)$474$450 -
VIP 95折
Manus應用與AI Agent設計指南:從入門到精通$359$341 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
87折
$360芯片的較量 (日美半導體風雲) -
VIP 95折
Manus AI 智能體從入門到精通$294$279 -
87折
$981深度學習:基礎與概念 -
85折
$505GitHub Copilot 編程指南 -
79折
$425Cursor 與 Copilot 開發實戰 : 讓煩瑣編程智能化 -
85折
$551C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
Verilog HDL計算機網絡典型電路算法設計與實現$354$336 -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
85折
$806Linux x64 匯編語言編程 -
VIP 95折
MCP 極簡開發 : 輕鬆打造高效智能體$479$455 -
VIP 95折
RISC-V 架構 DSP 處理器設計$534$507 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
85折
$454RAG 實踐權威指南:構建精準、高效大模型之道 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
87折
$360芯片的較量 (日美半導體風雲) -
85折
$505GitHub Copilot 編程指南 -
85折
$551C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673 -
VIP 95折
深入淺出 Docker, 2/e$419$398 -
85折
$658Unity 特效制作:Shader Graph 案例精講 -
79折
$275零基礎玩轉國產大模型DeepSeek -
VIP 95折
人工智能大模型:機器學習基礎$774$735 -
VIP 95折
RAG 極簡入門:原理與實踐$419$398 -
VIP 95折
大模型實戰 : 從零實現 RAG 與 Agent 系統$419$398 -
VIP 95折
算法趣學(第2版)$348$331 -
VIP 95折
大模型理論與實踐——打造行業智能助手$354$336 -
VIP 95折
大模型應用開發 RAG 實戰課$599$569 -
85折
$509生成式人工智能 (基於 PyTorch 實現)
相關主題
商品描述
本書以產業需求為牽引,介紹了新時期機器翻譯的產業需求特點、神經網絡機器翻譯的原理與方法、最新技術進展及產業應用。
內容包括大規模翻譯語料獲取技術、機器翻譯質量評價方法、神經網絡機器翻譯原理及主流方法、高性能機器翻譯、
多語言機器翻譯、領域自適應、機器同聲傳譯、大規模產業化應用等,兼具理論與實踐,
既有對原理與方法的介紹,又有豐富的產業應用案例。
作者簡介
吳華,百度技術委員會主席。長期從事機器翻譯、自然語言處理、機器學習等技術的研究及產業化工作。曾獲國家技術發明二等獎、國家科技進步二等獎、中國專利金獎、北京市科技進步一等獎、中國電子學會科技進步一等獎。被評為「傑出工程師」「青年北京學者」等。
目錄大綱
叢書序
推薦序一
推薦序二
前言
第1章緒論
1.1 機器翻譯發展簡介
1.2 機器翻譯代表性方法
1.2.1 基於規則的機器翻譯
1.2.2 統計機器翻譯
1.2.3 神經網絡機器翻譯
1.3 發展現狀
1.4 產業應用需求特點及挑戰
1.4.1 高翻譯質量
1.4.2 高系統性能
1.4.3 多語言翻譯
1.4.4 領域自適應
1.4.5 跨模態翻譯
1.5 本書結構
參考文獻
第2章翻譯語料獲取與譯文質量評價
2.1 概述
2.2 機器翻譯語料庫類型
2.2.1 雙語語料庫
2.2.2 單語語料庫
2.3 公開語料庫及系統評測
2.3.1 語言數據聯盟與NIST評測
2.3.2 歐洲議會語料庫與WMT評測
2.3.3 語音翻譯語料庫與IWSLT評測
2.3.4 中文語言資源聯盟與CCMT評測
2.4 從因特網獲取機器翻譯語料
2.4.1 因特網雙語語料存在形式
2.4.2 因特網語料常見問題
2.4.3 雙語語料挖掘與加工
2.5 機器翻譯質量評價
2.5.1 人工評價
2.5.2 自動評價
2.5.3 面向產業應用的評價
參考文獻
第3章神經網絡機器翻譯
3.1 概述
3.2 基於循環神經網絡的模型
3.2.1 基本模型
3.2.2 雙向編碼
3.2.3 註意力機制
3.2.4 長短時記憶與門控循環單元
3.3 基於捲積神經網絡的翻譯模型
3.4 全註意力模型
3.4.1 基本思想
3.4.2 模型結構
3.4.3 性能分析
3.5 非自回歸翻譯模型
3.6 搭建一個神經網絡機器翻譯系統
3.6.1 環境準備
3.6.2 模型訓練
3.6.3 解碼
3.6.4 效果評估
參考文獻
第4章高性能機器翻譯
4.1 概述
4.2 早期產業化神經網絡機器翻譯系統
4.2.1 百度神經網絡機器翻譯系統
4.2.2 谷歌神經網絡機器翻譯系統
4.3 Transformer模型優化
4.3.1 高效Transformer
4.3.2 針對機器翻譯的優化
4.4 模型壓縮
4.4.1 剪枝
4.4.2 量化
4.4.3 知識蒸餾
4.5 系統部署
4.5.1 分佈式系統部署
4.5.2 智能硬件設備
4.6 開源工具
參考文獻
第5章多語言機器翻譯
5.1 概述
5.2 數據增強
5.2.1 基於樞軸語言的合成語料庫方法
5.2.2 回譯技術
5.3 無監督機器翻譯
5.3.1 基本原理
5.3.2 跨語言向量映射
5.3.3 基於去噪自編碼器和回譯技術的翻譯模型
5.3.4 基於對偶學習的機器翻譯模型
5.4 多語言翻譯統一建模
5.4.1 基於多任務學習的翻譯模型
5.4.2 基於語言標籤的多語言翻譯模型
5.5 多語言預訓練
5.5.1 預訓練技術簡介
5.5.2 多語言預訓練模型
5.5.3 方法比較
5.6 多語言機器翻譯系統
5.6.1 百度多語言機器翻譯
5.6.2 谷歌多語言機器翻譯
5.6.3 臉書多語言機器翻譯
參考文獻
第6章領域自適應
6.1 概述
6.2 領域數據增強
6.2.1 領域數據聚類
6.2.2 領域數據篩選
6.2.3 領域數據擴充
6.3 模型訓練及優化
6.3.1 預訓練加微調技術
6.3.2 領域數據加權訓練
6.3.3 模型參數部分調優
6.3.4 基於知識蒸餾的領域自適應
6.3.5 基於課程表學習的領域自適應
6.4 專有名詞和術語的翻譯
6.4.1 前處理技術
6.4.2 後處理技術
6.4.3 融合專名/術語翻譯的解碼算法
6.5 翻譯記憶庫
6.5.1 基於記憶庫的數據增強
6.5.2 融合記憶庫的翻譯模型
6.5.3 k-近鄰翻譯模型
6.6 面向產業應用的領域自適應解決方案
參考文獻
第7章機器同聲傳譯
7.1 概述
7.2 主要挑戰
7.2.1 技術挑戰
7.2.2 數據挑戰
7.2.3 評價挑戰
7.3 級聯同傳模型
7.3.1 wait-k模型
7.3.2 語義單元驅動的同傳模型
7.3.3 基於強化學習的同傳模型
7.3.4 基於單調無限回溯註意力機制的同傳模型
7.4 端到端語音翻譯及同傳模型
7.4.1 從級聯模型至端到端模型的過渡
7.4.2 基於多任務學習的端到端模型
7.4.3 語音識別與翻譯交互解碼模型
7.4.4 端到端同傳模型
7.5 同傳模型魯棒性
7.5.1 融合音節信息的翻譯模型
7.5.2 語音識別糾錯
7.5.3 魯棒性翻譯模型
7.6 同傳數據
7.6.1 歐洲語言同傳語料庫
7.6.2 日英同傳語料庫
7.6.3 中英同傳語料庫
7.7 同傳評價
7.7.1 基於閱讀理解的翻譯質量評價
7.7.2 基於平均延遲的同傳時延評價
7.7.3 綜合翻譯質量和同傳時延的評價
7.8 機器同傳系統及產品
7.8.1 機器同傳系統
7.8.2 機器同傳產品形式
7.8.3 機器輔助同傳
7.9 搭建一個機器同傳系統
7.9.1 數據準備
7.9.2 訓練
7.9.3 解碼
參考文獻
第8章機器翻譯產業化應用
