數據算法:Hadoop/Spark大數據處理技巧 数据算法:Hadoop/Spark大数据处理技巧
Mahmoud Parsian(馬哈默德·帕瑞斯安)
- 出版商: 中國電力
- 出版日期: 2016-10-01
- 售價: $768
- 語言: 簡體中文
- 頁數: 696
- 裝訂: 平裝
- ISBN: 7512395949
- ISBN-13: 9787512395947
-
相關分類:
Hadoop、Spark、大數據 Big-data
- 此書翻譯自: Data Algorithms: Recipes for Scaling Up with Hadoop and Spark (Paperback)
已絕版
買這商品的人也買了...
-
Hadoop 管理手冊 (Hadoop Operations)$580$493 -
$294機器學習系統設計 (Building Machine Learning Systems with Python) -
精通 Python|運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)$780$616 -
建構微服務|設計細微化的系統 (Building Microservices)$580$458 -
Hadoop 技術手冊, 4/e (Hadoop: The Definitive Guide, 4/e)$980$774 -
$301Flask Web 開發:基於 Python 的 Web 應用開發實戰 (Flask Web Development: Developing Web Application with Python) -
網路規劃與管理實務 - 協助考取 CCNA 證照 200-125 最新版$860$731 -
貝葉斯方法:概率編程與貝葉斯推斷 (Bayesian Methods for Hackers: Probabilistic Programming and Bayesian Inference)$534$507 -
超圖解 Arduino 互動設計入門, 3/e$680$578 -
Python 自動化的樂趣|搞定重複瑣碎 & 單調無聊的工作 (中文版) (Automate the Boring Stuff with Python: Practical Programming for Total Beginners)$500$425 -
深度學習快速入門 — 使用 TensorFlow (Getting started with TensorFlow)
$360$281 -
Android App 程式設計教本之無痛起步 -- 使用 Android Studio 2.X 開發環境$580$458 -
圖解雲端技術|基礎架構x運作原理 x API$480$379 -
$354Web 接口開發與自動化測試 — 基於 Python 語言 -
TensorFlow + Keras 深度學習人工智慧實務應用$590$460 -
寫程式前就該懂的演算法 ─ 資料分析與程式設計人員必學的邏輯思考術 (Grokking Algorithms: An illustrated guide for programmers and other curious people)$390$308 -
$414Python 與機器學習實戰:決策樹、集成學習、支持向量機與神經網絡算法詳解及編程實現 -
$594Python 數據處理 (Data Wrangling with Python) -
實戰 TensorFlow|Google 深度學習系統$480$379 -
$301Spark與Hadoop大數據分析 (Big Data Analytics) -
演算法圖鑑:26種演算法 + 7種資料結構,人工智慧、數據分析、邏輯思考的原理和應用 step by step 全圖解$450$356 -
為你自己學 Git$500$425 -
Python 入門邁向高手之路王者歸來$699$594 -
$414OpenStack 常用部署 -
大數據的下一步:Spark MLlib機器學習實戰技巧大公開 (舊名: 比 Hadoop+Python 還強:Spark MLlib 機器學習實作)$520$442
商品描述
《數據算法:Hadoop/Spark大數據處理技巧》介紹了很多基本設計模式、優化技術和數據挖掘及機器學習解決方案,以解決生物信息學、基因組學、統計和社交網絡分析等領域的很多問題。這還概要介紹了MapReduce、Hadoop和Spark。
主要內容包括:
完成超大量交易的購物籃分析。
數據挖掘算法(K-均值、KNN和樸素貝葉斯)。
使用超大基因組數據完成DNA和RNA測序。
樸素貝葉斯定理和馬爾可夫鏈實現數據和市場預測。
推薦算法和成對文檔相似性。
線性回歸、Cox回歸和皮爾遜(Pearson)相關分析。
等位基因頻率和DNA挖掘。
社交網絡分析(推薦系統、三角形計數和情感分析)。
