Java數據科學實戰
Michael R. Brzustowicz 姜建錦,趙緒營,張岩譯
- 出版商: 人民郵電
- 出版日期: 2020-04-01
- 定價: $354
- 售價: 7.9 折 $280
- 語言: 簡體中文
- 頁數: 186
- 裝訂: 平裝
- ISBN: 711553330X
- ISBN-13: 9787115533302
-
相關分類:
Java 程式語言、Python
- 此書翻譯自: Data Science with Java: Practical Methods for Scientists and Engineers
-
相關翻譯:
Java 資料科學|科學與工程實務方法 (Data Science with Java: Practical Methods for Scientists and Engineers) (繁中版)
立即出貨
買這商品的人也買了...
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
《Java數據科學實戰》基於清晰的、面向對象的Java代碼,
討論了數據科學研究的一些基本原理。
考慮到項目所需的可伸縮性、穩健性以及便利性,Java是一門理想的語言。
本書解釋了數據科學過程每個步驟背後的基本數學原理,
以及如何將這些概念應用於Java。
本書內容涉及數據輸入與輸出、線性代數、統計學、數據操作、學習與預測,
以及Hadoop MapReduce在這個過程中所扮演的關鍵角色。
書中還提供了在應用程序中使用的代碼示例。
作者簡介
Michael R. Brzustowicz
從研究物理的博士後轉型為經驗豐富的數據科學家,
專註於建立分佈式數據系統,並從海量數據中提取知識。
他大部分的時間都在編寫(日常大數據問題的)
統計模型方法及機器學習方法的定製多線程代碼。
他是多家創業公司的合夥人,並在舊金山大學擔任兼職教授。
【譯者簡介】
薑建錦
清華大學博士,北京電子科技學院網絡空間安全系教師,
目前主要從事計算機系統結構、分佈式系統等的研究及相關教學工作。
趙緒營
中科院博士,北京電子科技學院網絡空間安全系教師,
目前主要從事生物特徵識別與加密,計算機視覺的研究及相關教學工作。
張巖
博士,北京電子科技學院網絡空間安全系副教授,
目前主要從事信息物理融合系統、軟件系統建模和驗證的研究及相關教學工作。
目錄大綱
前言xi
第1章數據的輸入與輸出1
1.1究竟何謂數據1
1.2數據模型2
1.2.1一維數組2
1.2.2多維數組2
1.2.3數據對象3
1 .2.4矩陣和向量3
1.2.5 JSON 4
1.3處理實際數據4
1.3.1空值4
1.3.2空格5
1.3.3解析錯誤5
1.3.4異常值6
1.4管理數據文件6
1.4.1首先理解文件內容7
1.4.2讀取文本文件8
1.4.3讀取JSON文件10
1.4.4讀取圖像文件11
1.4.5寫入文本文件12
1.5掌握數據庫操作15
1.5.1命令行客戶端15
1.5.2結構化查詢語言16
1.5.3 Java數據庫連接18
1.6通過繪圖將數據可視化20
1.6.1創建簡單圖形21
1.6.2混合類型圖的繪製24
1.6.3把圖存入文件26
第2章線性代數28
2.1構造向量和矩陣29
2.1.1數組存儲30
2.1.2塊存儲31
2.1.3映射存儲31
2.1.4訪問元素31
2.1.5處理子陣33
2.1.6隨機化34
2.2向量與矩陣的運算35
2.2.1縮放35
2.2.2轉置36
2.2.3加與減36
2.2.4長度37
2.2.5距離38
2.2.6相乘39
2.2. 7內積40
2.2.8外積41
2.2.9逐項積42
2.2.10複合運算43
2.2.11仿射變換43
2.2.12映射函數44
2.3矩陣分解47
2.3.1 Cholesky分解47
2.3.2 LU分解48
2.3.3 QR分解48
2.3.4奇異值分解48
2.3.5特徵分解49
2.3.6行列式50
2.3.7矩陣逆50
2.4求解線性方程組51
第3章統計學53
3.1數據的概率起源54
3.1.1概率密度54
3.1.2累積概率55
3.1 .3統計矩55
3.1.4熵56
3.1.5連續分佈57
3.1.6離散分佈68
3.2數據集的特徵73
3.2.1矩的計算73
3.2.2描述性統計74
3 .2.3多元統計79
3.2.4協方差與相關係數81
3.2.5回歸82
3.3處理大數據集84
3.3.1累積統計85
3.3.2統計結果的歸併87
3.3.3回歸88
3.4數據庫內置函數的應用89
第4章數據操作91
4.1轉換文本數據91
4.1.1從文檔中提取標記91
4.1.2利用字典92
4 .1.3文檔向量化94
4.2數值數據的縮放與歸一化97
4.2.1對列進行縮放97
4.2.2對行進行縮放99
4.2.3矩陣的縮放算子100
4.3將數據降維至主成分102
4.3.1協方差方法105
4.3.2 SVD方法106
4.4創建訓練集、驗證集及測試集108
4.4.1基於索引的重新採樣108
4.4.2基於列表的重新採樣110
4.4.3小批量111
4.5標籤的編碼111
4.5.1泛型編碼器111
4.5.2一位有效編碼112
第5章學習與預測115
5.1學習算法115
5.1.1疊代學習過程115
5 .1.2梯度下降優化方法117
5.2評估學習過程119
5.2.1損失函數最小化119
5.2.2方差和的最小化127
5.2.3輪廓係數127
5.2.4對數似然性128
5.2.5分類器的準確率129
5.3無監督型學習131
5.3.1 K均值聚類131
5.3.2 DBSCAN 133
5.3.3高斯混合137
5.4監督型學習141
5.4.1樸素貝葉斯142
5.4.2線性模型148
5.4.3深度網絡156
第6章Hadoop MapReduce 161
6.1 Hadoop分佈式文件系統161
6. 2 MapReduce體系結構162
6.3編寫MapReduce應用163
6.3.1剖析MapReduce任務164
6.3.2 Hadoop數據類型164
6.3.3映射器167
6.3.4歸約器168
6.3.5 JSON字符串作為文本的簡單性169
6.3.6部署技巧170
6.4 MapReduce示例171
6.4.1單詞計數171
6.4.2定製單詞計數172
6.4.3稀疏線性代數173
附錄A數據集177
作者簡介186
關於封面186
收起全部↑


