Google BigQuery權威指南 Google Bigquery: The Definitive Guide: Data Warehousing, Analytics, and Machine Learning at Scale

Lakshmanan, Valliappa, Tigani, Jordan 譯者:傅建慶//薑海龍//羅一鳴//潘飛

商品描述

你是否需要從PB級數據中獲取洞察,你是否希望構建協作、敏捷的工作空間?
本書是Google BigQuery的規範參考書,它的存儲系統可以幫助你整合企業的全部數據,
其查詢引擎可以支持對大型數據集的交互式分析和機器學習。
BigQuery幫助企業在一個便捷的框架中有效地存儲、查詢、導入數據,並從中學習。
本書作者提供了在基於serverless、自動擴縮容的公共雲上建立現代數據倉庫的最佳實踐。
無論你是想更全面地了解BigQuery,還是想專注於特定的任務,這份詳盡的指南都必不可少。
深入探討BigQuery的內部工作方式,包括其整體架構。
 學習BigQuery支持的數據類型、函數和運算符。
優化查詢語句和schema,從而提高性能或降低成本。
使用標準SQL中高級功能,如GIS、歷史快照、DDL/DML、用戶定義函數和腳本。
 使用BigQuery ML解決各類機器學習問題。
 學習如何保護數據、監控作業,以及授權用戶。

作者簡介

Jordan Tigani

是BigQuery的產品管理總監。
他是BigQuery的創始工程師之一,幫助BigQuery發展成Google雲計算中最成功的產品。
他寫了第一本關於BigQuery的書,並發表了諸多關於BigQuery的觀點。
Jordan有20年的軟件開發經驗,從微軟研究院到機器學習創業公司。

 

 

Valliappa Lakshmanan

是Google Cloud的數據分析和AI解決方案負責人。
他的團隊借助BigQuery和Google Cloud上的其他數據分析、機器學習產品,構建軟件解決方案來解決業務問題。

Jordan Tigani是BigQuery的產品管理總監。
作為BigQuery的創始工程師之一,他幫助數據倉庫發展成為Google Cloud中*成功的產品之一。
他擁有20年的軟件開發經驗。 "

目錄大綱

目錄
前言
第1章 Google BigQuery是什麼
數據處理架構
關係數據庫管理系統
MapReduce框架
BigQuery:一個Serverless、分佈式SQL引擎
使用BigQuery
從數據集中獲得洞察
ETL、EL和ELT
強大的分析能力
易於管理
BigQuery起源
是什麼使BigQuery成為可能?
計算和存儲分離
存儲和網絡基礎設施
存儲託管
與Google Cloud Platform集成
安全與合規
小結

第2章 基礎查詢語法
簡單查詢
使用SELECT檢索行
使用AS給列設置別名
使用WHERE進行過濾
SELECT*、EXCEPT和REPLACE
帶WITH的子查詢
使用ORDER BY進行排序
聚合
使用GROUP BY計算聚合
使用COUNT統計記錄數
使用HAVING過濾分組項
使用DISTINCT查找唯一值
數組與結構體簡介
使用ARRAY_AGG創建數組
結構體數組
元組
使用數組
UNNEST數組
Join表
Join釋疑
內連接
交叉連接
外連接
保存和分享
查詢歷史記錄和緩存
已保存的查詢
視圖與分享查詢
小結

第3章 數據類型、函數和運算符
數值類型和函數
……
第4章 將數據加載到BigQuery
第5章 使用BigQuery進行開發
第6章 BigQuery架構
第7章 性能與成本優化
第8章 高級查詢
第9章 BigQuery中的機器學習
第10章 BigQuery安全管理
作者介紹
封面介紹