ODPS 權威指南(阿里大數據平臺應用開發實踐) ODPS权威指南:阿里大数据平台应用开发实践

李妹芳

  • 出版商: 人民郵電
  • 出版日期: 2014-12-10
  • 定價: $414
  • 售價: 8.0$331
  • 語言: 簡體中文
  • 頁數: 320
  • 裝訂: 平裝
  • ISBN: 7115372411
  • ISBN-13: 9787115372413
  • 相關分類: 大數據 Big-data
  • 立即出貨 (庫存=1)

買這商品的人也買了...

商品描述

<內容簡介>

ODPS(Open Data Processing Service)是阿裡巴巴自主研發的海量數據處理和分析的服務平臺,主要應用於數據分析、海量數據統計、數據挖掘、機器學習和商業智能等領域。目前,ODPS不僅在阿裡內部得到廣泛應用,享有很好的口碑,正逐步走向第三方開放市場。
    李妹芳著的《ODPS權威指南(阿裡大數據平臺應用開發實踐)》是學習和掌握ODPS的權威指南,作者來自阿裡ODPS團隊。全書共13章,主要內容包括:ODPS入門、整體架構、數據通道、MapReduce編程、SQL查詢分析、安全,以及基於真實數據的各種場景分析實戰。本書基於很多範例解析,通過在各種應用場景下的示例來說明如何通過ODPS完成各種需求,以期引導讀者從零開始輕鬆掌握和使用ODPS。同時,本書不局限於示例分析,也致力於提供更多關於大數據處理的編程思想和經驗分享。書中所有示例代碼都可以在作者提供的網站上免費下載。
    本書適合想要瞭解和使用ODPS的讀者閱讀學習,對於從事大數據存儲和應用以及分佈式計算的專業人士來說,也是很好的參考資料。

<目錄>

前言
第1章 ODPS概述
  1.1 引言
  1.2 初識ODPS
    1.2.1 背景和挑戰
    1.2.2 為什麼做ODPS
    1.2.3 ODPS是什麼
    1.2.4 ODPS做什麼
  1.3 基本概念
    1.3.1 賬號(Account)
    1.3.2 項目空間(Project)
    1.3.3 表(Table)
    1.3.4 分區(Partition)
    1.3.5 任務(Task)、作業(Job)和作業實例(Instance)
    1.3.6 資源(Resource)
  1.4 應用開發模式
    1.4.1 RESTful API
    1.4.2 ODPS SDK
    1.4.3 ODPS CLT
    1.4.4 管理控制台
    1.4.5 IDE
  1.5 一些典型場景
    1.5.1 阿裡金融數據倉庫
    1.5.2 CNZZ數據倉庫
    1.5.3 支付寶賬號影響力圈
    1.5.4 阿裡金融水文衍生演算法
    1.5.5 阿裡媽媽廣告CTR預估
  1.6 現狀和前景
  1.7 小結
第2章 ODPS入門
  2.1 準備工作
    2.1.1 創建雲賬號
    2.1.2 開通ODPS服務
  2.2 使用管理控制台
  2.3 配置ODPS客戶端
    2.3.1 下載和配置CLT
    2.3.2 準備dual表
    2.3.3 CLT運行模式
    2.3.4 下載和配置dship
    2.3.5 通過dship上傳下載數據
  2.4 網站日誌分析實例
    2.4.1 場景和數據說明
    2.4.2 需求分析
    2.4.3 數據準備
    2.4.4 創建表並添加分區
    2.4.5 數據解析和導入
    2.4.6 數據加工
    2.4.7 數據分析
    2.4.8 自動化運行
    2.4.9 應用數據集市
    2.4.10 結果導出
    2.4.11 結果展現
……

第3章 收集海量數據
第4章 使用SQL處理海量數據
第5章 SQL進階
第6章 通過TUNNEL遷移數據
第7章 使用MAPREDUCE處理數據
第8章 MAPREDUCE進階
第9章 機器學習演算法
第10章 使用SDK訪問ODPS服務
第11章 ODPS賬號、資源和數據管理
第12章 深入瞭解ODPS
第13章 探索ODPS之美