大數據理論與工程實踐

陸晟 劉振川 汪關盛 等

  • 出版商: 人民郵電
  • 出版日期: 2018-12-01
  • 定價: $348
  • 售價: 8.5$296
  • 語言: 簡體中文
  • 頁數: 299
  • 裝訂: 平裝
  • ISBN: 7115496838
  • ISBN-13: 9787115496836
  • 相關分類: 大數據 Big-data
  • 下單後立即進貨 (約4週~6週)

商品描述

本書主要面向架構師,或者是有具體大數據問題需要解決的工程師;也適合從零開始搭建大數據結構,或者需要將現有的非大數據的需求修改成大數據方案的讀者。你將從書中學到以下方面的知識:

◎數據存儲
◎計算資源
◎計算模型
◎大數據應用
◎數據治理
◎大數據與人工智能

作者簡介

陸晟博士
曾任IBM中國研究院研究員,涉及高性能計算、人機交互、虛擬世界等領域,最早在國內推廣云計算相關技術。參與創立過烽火安網公司,創立了北京敏思創想軟件技術有限公司。此外,先後擔任過VMware主任工程師、品友互動技術工程副總裁、豬八戒網商業基礎設施中心高級總監兼大數據事業部總經理等職務。現任美數信息科技公司首席技術官。從1995年開始參與中國教育和科研網的建設工作,並以第六完成人獲江蘇省科技進步二等獎,以第二作者參與過《計算機網絡安全導論》第1版的編著。獲得國內外專利授權超過15項。

劉振川
長期擔任品友互動首席研究員。從事廣告行業十餘年,歷經了國內數字廣告從0到1的誕生及發展過程。熟悉廣告行業的各個技術模塊,主導設計開發廣告投放、數據分析、人群畫像、算法支撐等系統。目前的研究專注於數字營銷的智能決策方向。

汪關盛
美數信息科技公司創始人、國際數據管理協會(DAMA)中國分會資深顧問。從事數據行業20多年,曾任職美國銀行、畢馬威、美國在線、谷歌等公司,擔任資深諮詢員和首席構架師。1999年成立美數集團公司。2012年起兼任北京交通大學大數據教授,講授大數據相關的碩士和博士全英文課程。受邀在中國平安、騰訊、阿里巴巴、復旦大學在內的多家國內知名企業和高校做過主題演講。

目錄大綱

第1章概述1 
大數據處理的特徵/ 3 
基本處理模型/ 5 
工程角度的大數據歷史/ 8 
大數據的基本處理框架/ 10 
大數據的技術實施方法/ 13 
第2章數據21 
數據存儲/ 23 
數據尋址/ 28 
列式存儲/ 34 
鍵值對高速緩存/ 43 
持久化的高速緩存/ 54 
大數據表/ 65 
第3章計算資源73 
集群總線/ 75 
資源調度/ 91 
資源控制/ 97 
第4章計算模型109 
MapReduce / 111 
SQL類查詢/ 115 
流式計算/ 119 
圖計算/ 125 
第5章大數據應用133 
搜索信息匹配/ 136 
搜索信息排名/ 140 
文檔相似性判定/ 147 
文檔主題生成/ 152 
用戶畫像/ 163 
廣告投放決策/ 175 
基數計算/ 191 
第6章數據治理199 
元數據管理/ 202 
主數據管理/ 207
數據標準/ 209 
數據管理成熟度評估/ 213 
數據資產/ 220 
數據治理的組織構架/ 230 
第7章大數據和人工智能233 
大數據和計算機視覺/ 236 
大數據和語音識別/ 259 
大數據和博弈/ 284 
術語表291 
作者介紹299