智能 Web 算法, 2/e (Algorithms of the Intelligent Web, 2/e) 智能Web算法(第2版)

Douglas G. McIlwraith^Haralambos Marmanis^Dmitry Babenko

買這商品的人也買了...

商品描述

《智能Web算法(第2版)》內容提要
機器學習一直是人工智能研究領域的重要方向,而在大數據時代,來自Web 的數據採集、挖掘、應用技術又越來越受到矚目,並創造著巨大的價值。本書是有關Web數據挖掘和機器學習技術的一本知名的著作,第2 版進一步加入了本領域最新的研究內容和應用案例,介紹了統計學、結構建模、推薦系統、數據分類、點擊預測、深度學習、效果評估、數據採集等眾多方面的內容。《智能Web算法(第2版)》內容翔實、案例生動,有很高的閱讀價值。
《智能Web算法(第2版)》適合對算法感興趣的工程師與學生閱讀,對希望從業務角度更好地理解機器學習技術的產品經理和管理層來說,亦有很好的參考價值。

作者簡介

原作者簡介
Douglas McIlwraith博士在劍橋大學計算機科學系獲得了學士學位,而後在帝國理工大學獲得了博士學位。他是一位機器學習專家,目前他在位於倫敦的一家廣告網絡公司擔任數據科學家職位。他在分佈式系統、普適計算、通用感知、機器人以及安全監控方面都貢獻了研究成果,他為讓技術更好地服務人們的生活而無比激動。
Haralambos Marmanis博士是將機器學習技術引入工業解決方案的先驅,在專業軟件研發方面擁有25年經驗。
Dmitry Babenko為銀行、保險、供應鏈管理、商業智能企業等設計和開發了豐富的應用和系統架構。他擁有白俄羅斯國立信息和無線電大學計算機碩士學位。

譯者簡介
陳運文,計算機博士,達觀數據CEO,ACM和IEEE會員,中國計算機學會高級會員;在大數據架構設計、搜索和推薦引擎、文本數據挖掘等領域有豐富的研發經驗;曾經擔任盛大文學首席數據官、騰訊文學數據中心高級總監、百度核心算法工程師等工作,申請有30餘項國家發明專利,多次參加國際ACM數據算法競賽並獲得冠亞軍榮譽。

目錄大綱

第1章為智能Web建立應用1 

1.1智能算法的實踐運用:Google Now3 
1.2智能算法的生命週期5 
1.3智能算法的更多示例6 
1.4不屬於智能應用的內容7 
1.4.1智能算法並不是萬能的思考機器7 
1.4.2智能算法並不能成為完全代替人類的工具8 
1.4.3智能算法的發展並非一蹴而就8 
1.5智能算法的類別體系9 
1.5.1人工智能9 
1.5.2機器學習10 
1.5.3預測分析11 
1.6評估智能算法的效果13 
1.6.1評估智能化的程度13 
1.6.2評估預測14 
1.7智能算法的重點歸納16 
1.7.1你的數據未必可靠16 
1.7.2計算難以瞬間完成17 
1.7. 3數據規模非常重要17 
1.7.4不同的算法具有不同的擴展能力18 
1.7.5並不存在萬能的方法18 
1.7.6數據並不是萬能的18 
1.7.7模型訓練時間差異很大18 
1.7.8泛化能力是目標19 
1.7.9人類的直覺未必準確19 
1.7.10要考慮融入更多新特徵19 
1.7.11要學習各種不同的模型19 
1.7.12相關關係不等同於因果關係20 
1.8本章小結20 

第 2章從數據中提取結構:聚類和數據變換21 

2.1數據、結構、偏見和噪聲23 
2.2維度詛咒26 
2.3k—means算法27 
2.3.1實踐運用k—means31 
2.4高斯混合模型34 
2.4.1什麼是高斯分佈34 
2.4.2期望最大與高斯分佈37 
2.4.3高斯混合模型37 
2.4.4高斯混合模型的學習實例38 
2.5k—means和GMM的關係41 
2.6數據坐標軸的變換42 
2.6.1特徵向量和特徵值43 
2.6.2主成分分析43 
2.6.3主成分分析的示例45 
2.7本章小結47 

第3章推薦系統的相關內容48 

3.1場景設置:在線電影商店49 
3.2距離和相似度50 
3.2. 1距離和相似度的剖析54 
3.2.2最好的相似度公式是什麼56 
3.3推薦引擎是如何工作的57 
3.4基於用戶的協同過濾59 
3.5奇異值分解用於基於模型的推薦64 
3.5.1奇異值分解64 
3.5.2使用奇異值分解進行推薦:為用戶挑選電影66 
3.5.3使用奇異值分解進行推薦:幫電影找到用戶71 
3.6Net.ix競賽74 
3.7評估推薦系統76 
3.8本章小結78 

第4章分類 將物品歸類到所屬的地方79 

4.1對分類的需求80 
4.2分類算法概覽83 
4.2.1結構性分類算法84 
4.2.2統計性分類算法86 
4.2.3分類器的生命週期87 
4.3基於邏輯回歸的欺詐檢測88 
4.3.1線性回歸簡介89 
4.3.2從線性回歸到邏輯回歸91 
4.3.3欺詐檢測的應用94 
4.4你的結果可信嗎102 
4.5大型數據集的分類技術106 
4.6本章小結108 

第5章在線廣告點擊預測109 

5.1歷史與背景110 
5.2廣告交易平台112 
5.2.1cookie匹配113 
5.2.2競價(bid)113 
5.2.3競價成功(或失敗)的通知114 
5.2.4廣告展示位114 
5.2. 5廣告監測115 
5.3什麼是bidder115 
5.3.1bidder的需求116 
5.4何為決策引擎117 
5.4.1用戶信息117 
5.4.2廣告展示位信息117 
5.4.3上下文信息117 
5.4.4數據準備118 
5.4.5決策引擎模型118 
5.4.6將點擊率預測值映射為競價價格118 
5.4.7特徵工程119 
5.4.8模型訓練119 
5.5使用VowpalWabbit進行點擊預測120 
5.5.1VowpalWabbit的數據格式120 
5.5.2準備數據集123 
5 . 5.3測試模型128 
5.5.4模型修正131 
5.6構建決策引擎的複雜問題132 
5.7實時預測系統的前景133 
5.8本章小結134 

第6章深度學習和神經網絡135 

6.1深度學習的直觀方法136 
6.2神經網絡137 
6.3感知機139 
6.3.1模型訓練141 
6.3.2用scikit—learn訓練感知機142 
6.3.3兩個輸入值的感知機的幾何解釋144 
6.4多層感知機146 
6.4.1用反向傳播訓練150 
6.4 .2激活函數150 
6.4.3反向傳播背後的直觀理解152 
6.4.4反向傳播理論153 
6.4.5scikit—learn中的多層神經網絡155 
6.4.6訓練出來的多層感知機158 
6.5更深層:從多層神經網絡到深度學習159 
6.5.1受限玻耳茲曼機160 
6.5.2伯努利受限玻耳茲曼機160 
6.5.3受限玻耳茲曼機實戰164 
6.6本章小結167 

第7章做出正確的選擇168 

7.1A/B測試170 
7.1.1相關的理論170 
7.1.2評估代碼173 
7.1.3A/B測試的適用性174 
7.2多臂賭博機175 
7.2.1多臂賭博機策略176 
7.3實踐中的貝葉斯賭博機策略180 
7.4A/B測試與貝 葉斯賭博機的對比191 
7.5擴展到多臂賭博機192 
7.5.1上下文賭博機193 
7.5.2對抗賭博機193 
7.6本章小結194 

第8章智能Web的未來196 

8.1智能Web的未來應用197 
8.1. 1物聯網197 
8.1.2家庭健康護理198 
8.1.3自動駕駛汽車198 
8.1.4個性化的線下廣告199 
8.1.5語義網199 
8.2智能Web的社會影響200 
附錄A抓取網絡上的數據201