機器學習實踐:數據科學應用與工作流的開發及優化
Andrew Kelleher ,Adam Kelleher 陳子墨劉瀚文譯譯
- 出版商: 機械工業
- 出版日期: 2020-04-01
- 定價: $594
- 售價: 7.9 折 $469
- 語言: 簡體中文
- 頁數: 244
- 裝訂: 平裝
- ISBN: 7111651367
- ISBN-13: 9787111651369
-
相關分類:
Machine Learning
立即出貨 (庫存 < 4)
買這商品的人也買了...
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書以作者在BuzzFeed的工作經驗為基礎,
將機器學習和計算機工程巧妙地結合在一起。
第壹部分的基本原則是數據科學世界堅實的基礎;
第二部分介紹現實問題中的常用算法,幫助讀者迅速解決實際問題,
避免被數據誤導、產生結論錯誤;
第三部分則著眼於工程實踐,基於工程角度突破瓶頸,
讓算法能夠在現實條件中得以實現。
目錄大綱
譯者序
序
前言
作者簡介
第一部分框架原則
第1章數據科學家的定位2
1.1引言2
1.2數據科學家扮演的角色2
1.2.1公司規模3
1.2.2團隊背景3
1.2.3職業晉升和發展4
1.2 .4重要性5
1.2.5工作細分5
1.3結論5
第2章項目流程7
2.1引言7
2.2數據團隊背景7
2.2.1專門崗位與資源池8
2.2.2研究分析8
2.2.3原型設計9
2.2.4集成的工作流10
2.3敏捷開發與產品定位10
2.4結論15
第3章量化誤差16
3.1引言16
3.2量化測量值的誤差16
3.3抽樣誤差18
3.4誤差傳遞20
3.5結論22
第4章數據編碼與預處理23
4.1引言23
4.2簡單文本預處理24
4.2.1分詞24
4.2.2 n元模型26
4.2.3稀疏26
4.2.4特徵選擇27
4.2.5表示學習29
4.3信息量損失31
4.4結論33
第5章假設檢驗34
5.1引言34
5.2什麼是假設34
5.3假設檢驗的錯誤類型36
5.4 p值和置信區間37
5.5多重測試和p值操控38
5.6實例39
5.7假設檢驗的設計40
5.8結論41
第6章數據可視化43
6.1引言43
6.2數據分佈和匯總統計43
6.2.1數據分佈和直方圖44
6.2.2散點圖和熱力圖48
6.2.3箱線圖和誤差條52
6.3時間序列圖54
6.3.1移動統計54
6.3.2自相關56
6.4圖可視化57
6.4.1佈局算法57
6.4.2時間複雜度59
6.5結論60
第二部分算法與架構
第7章算法和架構簡介62
7.1引言62
7.2架構64
7.2.1服務64
7.2.2數據源65
7.2.3分批及在線計算66
7.2.4規模擴展66
7.3模型67
7.3.1訓練68
7.3.2預測68
7.3.3驗證69
7.4結論70
第8章距離度量71
8.1引言71
8.2 Jaccard距離71
8.2.1算法72
8.2.2時間複雜度73
8.2.3內存註意事項73
8.2.4分佈式方法73
8.3 MinHash 74
8.3.1假設75
8.3.2時空複雜度75
8.3.3工具75
8.3.4分佈式方法75
8.4餘弦相似度76
8.4.1複雜度78
8.4.2內存註意事項78
8.4.3分佈式方法78
8.5馬氏距離78
8.5.1複雜度79
8.5.2內存註意事項79
8.5.3分佈式方法79
8.6結論80
第9章回歸81
9.1引言81
9.1.1選擇模型82
9.1.2選擇目標函數82
9.1.3模型擬合83
9.1.4模型驗證84
9.2線性最小二乘87
9.2.1假設88
9.2.2複雜度89
9.2.3內存註意事項89
9.2.4工具89
9.2.5分佈式方法89
9.2.6實例90
9.3線性回歸中的非線性回歸97
9.4隨機森林100
9.4.1決策樹100
9.4.2隨機森林103
9.5結論106
第10章分類和聚類107
10.1引言107
10.2邏輯回歸108
10.2.1假設111
10.2.2時間複雜度111
10.2.3內存註意事項112
10.2.4工具112
10.3貝葉斯推斷與樸素貝葉斯112
10.3.1假設114
10.3.2複雜度114
10.3.3內存註意事項114
10.3.4工具114
10.4 K-Means 115
10.4.1假設118
10.4.2複雜度118
10.4.3內存註意事項118
10.4.4工具118
10.5最大特徵值118
10.5.1複雜度120
10.5.2內存註意事項120
10.5.3工具120
10.6 Louvain貪心算法120
10.6.1假設121
10.6.2複雜度121
10.6.3內存註意事項121
10.6.4工具121
10.7最近鄰算法121
10.7.1假設123
10.7.2複雜度123
10.7.3內存註意事項123
10.7.4工具123
10.8結論123
第11章貝葉斯網絡125
11.1引言125
11.2因果圖、條件獨立和馬爾可夫126
11.2.1因果圖和條件獨立126
11.2.2穩定性和依賴性127
11.3 d分離和馬爾可夫性質128
11.3.1馬爾可夫和因式分解128
11.3.2 d分離129
11.4貝葉斯網絡的因果圖132
11.5模型擬合133
11.6結論136
第12章降維與隱變量模型137
12.1引言137
12.2先驗137
12.3因子分析139
12.4主成分分析140
12.4 .1複雜度142
12.4.2內存註意事項142
12.4.3工具142
12.5獨立成分分析142
12.5.1假設145
12.5.2複雜度145
12.5.3內存註意事項146
12.5.4工具146
12.6 LDA主題模型146
12.7結論152
第13章因果推斷153
13.1引言153
13.2實驗154
13.3觀測值:一個實例157
13.4非因果阻斷控製法163
13.5機器學習估計量167
13.5.1重新審視G公式167
13.5.2實例168
13.6結論172
第14章高級機器學習173
14.1引言173
14.2優化173
14.3神經網絡175
14.3.1神經網絡層176
14.3.2神經網絡容量177
14.3.3過擬合179
14.3.4批擬合183
14.3.5損失函數183
14.4結論185
第三部分瓶頸和優化
第15章硬件基礎188
15.1引
