Data Algorithms: Recipes for Scaling Up with Hadoop and Spark (Paperback)
暫譯: 數據演算法:使用 Hadoop 和 Spark 擴展的配方 (平裝本)
Mahmoud Parsian
- 出版商: O'Reilly
- 出版日期: 2015-08-11
- 定價: $2,300
- 售價: 9.5 折 $2,185
- 貴賓價: 9.0 折 $2,070
- 語言: 英文
- 頁數: 778
- 裝訂: Paperback
- ISBN: 1491906189
- ISBN-13: 9781491906187
-
相關分類:
Hadoop、Spark
-
相關翻譯:
數據算法:Hadoop/Spark大數據處理技巧 (簡中版)
立即出貨
買這商品的人也買了...
-
Statistics and Data with R: An applied approach through examples (Hardcover)$3,680$3,496 -
Complex Surveys: A Guide to Analysis Using R (Paperback)$3,520$3,344 -
Graphics for Statistics and Data Analysis with R (Hardcover)$2,640$2,508 -
$399R Cookbook (Paperback) -
R in a Nutshell, 2/e (Paperback)$1,995$1,890 -
$825R Graphics Cookbook (Paperback) -
體驗經濟時代 (10週年修訂版)$420$332 -
第三次工業革命-世界經濟即將被顛覆,新能源與商務、政治、教育的全面革命 (The Third Industrial Revolution: How Lateral Power Is Transforming Energy)$420$332 -
Doing Data Science: Straight Talk from the Frontline (Paperback)$1,881$1,782 -
$1,680An Introduction to Statistical Learning: With Applications in R (Hardcover) -
ASP.NET MVC 5 網站開發美學$780$616 -
Advanced R (Paperback)$2,600$2,470 -
啊哈!圖解演算法必學基礎$350$298 -
Android App 程式設計教本之無痛起步 -- 使用 Android Studio 開發環境$550$468 -
JavaScript 設計模式與開發實踐$460$359 -
Microsoft Azure 教戰手札 – 系統建置與管理篇, 3/e$550$435 -
精通 Python|運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)$780$616 -
完整學會 Git, GitHub, Git Server 的24堂課$360$284 -
演算法的樂趣|23個程式設計必學主題與應用實例$480$408 -
JavaScript 錦囊妙計, 2/e (JavaScript Cookbook, 2/e)$880$695 -
零售4.0 : 零售革命,邁入虛實整合的全通路時代$450$383 -
黑帽 Python | 給駭客與滲透測試者的 Python 開發指南 (Black Hat Python: Python Programming for Hackers and Pentesters)$400$316 -
Hadoop + Spark 大數據巨量分析與機器學習整合開發實戰$620$484 -
瀏覽器語言專用 3D引擎: WebGL 完全剖析 (舊版:WebGL 專業級 3D 引擎降臨-使用瀏覽器語言開發)$680$578 -
網站入侵現場鑑證實錄$380$300
商品描述
Learn the algorithms and tools you need to build MapReduce applications with Hadoop and Spark for processing gigabyte, terabyte, or petabyte-sized datasets on clusters of commodity hardware. With this practical book, author Mahmoud Parsian, head of the big data team at Illumina, takes you step-by-stepthrough the design of machine-learning algorithms, such as Naive Bayes and Markov Chain, and shows you how apply them to clinical and biological datasets, using MapReduce design patterns.
- Apply MapReduce algorithms to clinical and biological data, such as DNA-Seq and RNA-Seq
- Use the most relevant regression/analytical algorithms used for different biological data types
- Apply t-test, joins, top-10, and correlation algorithms using MapReduce/Hadoop and Spark
商品描述(中文翻譯)
學習您需要的算法和工具,以便使用 Hadoop 和 Spark 建立 MapReduce 應用程式,處理在一般硬體集群上大小為千兆字節、太字節或拍字節的數據集。這本實用的書籍由 Illumina 大數據團隊負責人 Mahmoud Parsian 撰寫,將逐步引導您設計機器學習算法,例如 Naive Bayes 和馬可夫鏈,並展示如何將它們應用於臨床和生物數據集,使用 MapReduce 設計模式。
- 將 MapReduce 算法應用於臨床和生物數據,例如 DNA-Seq 和 RNA-Seq
- 使用最相關的回歸/分析算法,針對不同的生物數據類型
- 使用 MapReduce/Hadoop 和 Spark 應用 t 檢驗、聯接、前十名和相關算法
