深度學習搜索引擎開發 Java 實現
Tommaso Teofili
- 出版商: 人民郵電
- 出版日期: 2020-10-01
- 售價: $474
- 貴賓價: 9.5 折 $450
- 語言: 簡體中文
- 頁數: 259
- 裝訂: 平裝
- ISBN: 7115547262
- ISBN-13: 9787115547262
-
相關分類:
DeepLearning、Java 程式語言
立即出貨 (庫存=1)
買這商品的人也買了...
-
$653Linux 多線程服務端編程:使用 muduo C++ 網絡庫 -
$474駕馭文本(文本的發現組織和處理) -
$234自製搜尋引擎 -
$301Elasticsearch 服務器開發, 2/e (ElasticSearch Server, 2/e) -
$294乾淨的數據:數據清洗入門與實踐, (Clean Data) -
$403大數據架構和算法實現之路:電商系統的技術實戰(Big Data Architecture and Algorithm in Action the Implementation in E-Commerce Systems) -
網站可靠性工程|Google 的系統管理之道 (Site Reliability Engineering: How Google Runs Production Systems)(SRE)-*外觀稍有瑕疵,不介意者再下單$780$616 -
$294Java 機器學習 (Machine Learning in Java) -
Linux 二進制分析$354$336 -
$474Spring 微服務實戰 (Spring Microservices in Action) -
$474深入 RabbitMQ -
$474Elasticsearch 實戰 (Elasticsearch in Action) -
深度學習|內行人的做法 (Deep Learning: A Practitioner's Approach)$780$616 -
基於 CUDA 的 GPU 並行程序開發指南 (GPU Parallel Program Development Using CUDA)$1,074$1,020 -
$709深入解析 CSS (CSS in Depth) -
$374基於深度學習的自然語言處理 -
$571HTTP/2 in Action (簡體中文版) -
$474RocketMQ 分佈式消息中間件:核心原理與最佳實踐 -
$403IntelliJ IDEA 入門與實戰 -
小輕快跨平台:王的編輯器 Visual Studio Code 聖經$880$695 -
網站可靠性工程 導讀會(入場票 + 書)$685$685 -
$236深入淺出深度學習 -
C++ 程式設計的樂趣|範例實作與專題研究的程式設計課 (C++ Crash Course: A Fast-Paced Introduction)$880$695 -
簡約的軟體開發思維:用 Functional Programming 重構程式 - 以 Javascript 為例 (Grokking Simplicity: Taming Complex Software with Functional Thinking)$1,000$790 -
先整理一下?|個人層面的軟體設計考量 (Tidy First?: A Personal Exercise in Empirical Software Design)$480$379
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書是市面上少見的將搜索與深度學習相結合的書,討論了使用(深度)神經網絡來幫助建立有效的搜索引擎的方法。閱讀本書無須具備開發搜索引擎的背景,也不需要具備有關機器學習或深度學習的預備知識,因為本書將介紹所有相關的基礎知識和實用技巧。書中研究了搜索引擎的幾個組成部分,不僅針對它們的工作方式提供了一些見解,還為在不同環境中使用神經網絡提供了指導。讀完本書,你將深入理解搜索引擎面臨的主要挑戰、這些挑戰的常見解決方法以及深度學習所能提供的幫助。你將清晰地理解幾種深度學習技術以及它們在搜索環境中的適用範圍,並深入瞭解Lucene和Deeplearning4j庫。書中示例代碼用Java編寫。
作者簡介
托馬索·泰奧菲利(Tommaso Teofili)
Red Hat公司高級軟件工程師,曾擔任Adobe公司軟件工程師,對開源和人工智能充滿熱情。他是Apache軟件基金會的成員,參與了許多項目,涉及信息檢索、自然語言處理和分佈式計算等主題。
【譯者簡介】
李軍
電子科技大學電腦應用技術碩士,《IDA Pro代碼破解揭密》合作譯者,現從事電力系統自動化工作。
天舒
曾就讀於四川大學電氣工程及自動化專業,英國曼徹斯特大學電力系統工程碩士,現從事電力系統自動化工作。
目錄大綱
第 一部分 當搜索遇上深度學習
第 1章 神經搜索 2
1.1 神經網絡及深度學習 3
1.2 什麼是機器學習 5
1.3 深度學習能為搜索做什麼 7
1.4 學習深度學習的路線圖 9
1.5 檢索有用的信息 10
1.5.1 文本、詞素、詞項和搜索基礎 11
1.5.2 相關性優先 18
1.5.3 經典檢索模型 19
1.5.4 精確率與召回率 20
1.6 未解決的問題 20
1.7 打開搜索引擎的黑盒子 21
1.8 利用深度學習解決問題 22
1.9 索引與神經元 26
1.10 神經網絡訓練 26
1.11 神經搜索的前景 28
1.12 總結 29
第 2章 生成同義詞 30
2.1 同義詞擴展介紹 31
2.1.1 為什麼要使用同義詞 32
2.1.2 基於詞匯表的同義詞匹配 33
2.2 語境的重要性 42
2.3 前饋神經網絡 43
2.3.1 前饋神經網絡如何工作:權重和激活函數 44
2.3.2 簡述反向傳播 45
2.4 使用word2vec 46
2.4.1 在Deeplearning4j中設置word2vec 53
2.4.2 基於word2vec的同義詞擴展 54
2.5 評價和比較 57
2.6 用於生產系統時的考慮 58
2.7 總結 61
第二部分 將神經網絡用於搜索引擎
第3章 從純檢索到文本生成 64
3.1 信息需求與查詢:彌補差距 65
3.1.1 生成可選查詢 65
3.1.2 數據準備 67
3.1.3 生成數據的小結 73
3.2 學習序列 73
3.3 循環神經網絡 75
3.3.1 循環神經網絡內部結構和動態 77
3.3.2 長期依賴 80
3.3.3 LSTM網絡 81
3.4 用於無監督文本生成的LSTM網絡 81
3.5 從無監督文本生成到監督文本生成 92
3.6 生產系統的考慮因素 95
3.7 總結 96
第4章 更靈敏的查詢建議 97
4.1 生成查詢建議 98
4.1.1 編寫查詢時的建議 98
4.1.2 基於字典的建議算法 99
4.2 Lucene Lookup API 99
4.3 分析後的建議算法 102
4.4 使用語言模型 108
4.5 基於內容的建議算法 111
4.6 神經語言模型 112
4.7 基於字符的神經語言建議模型 114
4.8 調優LSTM 語言模型 117
4.9 使用詞嵌入使建議多樣化 125
4.10 總結 127
第5章 用詞嵌入對搜索結果排序 128
5.1 排序的重要性 128
5.2 檢索模型 130
5.2.1 TF-IDF與向量空間模型 132
5.2.2 在Lucene中對文檔進行排序 134
5.2.3 概率模型 137
5.3 神經信息檢索 138
5.4 從單詞到文檔向量 139
5.5 評價和比較 144
5.6 總結 149
第6章 用於排序和推薦的文檔嵌入 150
6.1 從詞嵌入到文檔嵌入 150
6.2 在排序中使用段向量 154
6.3 文檔嵌入及相關內容 157
6.3.1 搜索、推薦和相關內容 157
6.3.2 使用高頻詞項查找相似內容 159
6.3.3 使用段向量檢索相似內容 166
6.3.4 從編碼器-解碼器模型用向量檢索相似內容 169
6.4 總結 170
第三部分 延伸
第7章 跨語言搜索 172
7.1 為講多種語言的用戶提供服務 172
7.1.1 翻譯文檔與查詢 174
7.1.2 跨語言搜索 175
7.1.3 在Lucene上進行多語言查詢 176
7.2 統計機器翻譯 178
7.2.1 對齊 180
7.2.2 基於短語的翻譯 181
7.3 使用並行語料庫 181
7.4 神經機器翻譯 184
7.4.1 編碼器-解碼器模型 184
7.4.2 DL4J中用於機器翻譯的編碼器-解碼器 187
7.5 多語言的單詞和文檔嵌入 194
7.6 總結 199
第8章 基於內容的圖像搜索 200
8.1 圖像內容和搜索 201
8.2 回顧:基於文本的圖像檢索 203
8.3 理解圖像 204
8.3.1 圖像表示 206
8.3.2 特徵提取 208
8.4 圖像表示的深度學習 215
8.4.1 捲積神經網絡 216
8.4.2 圖像搜索 224
8.4.3 局部敏感散列 228
8.5 處理未標記的圖像 231
8.6 總結 235
第9章 性能一瞥 236
9.1 深度學習的性能與約定 237
9.2 索引和神經元協同工作 251
9.3 使用數據流 254
9.4 總結 259
展望未來 260


