Jumpstart Snowflake: A Step-By-Step Guide to Modern Cloud Analytics
暫譯: 快速上手 Snowflake:現代雲端分析的逐步指南
Anoshin, Dmitry, Foshin, Dmitry, Strok, Donna
相關主題
商品描述
This book is your guide to the modern market of data analytics platforms and the benefits of using Snowflake, the data warehouse built for the cloud. As organizations increasingly rely on modern cloud data platforms, the core of any analytics framework--the data warehouse--is more important than ever. This updated 2nd edition ensures you are ready to make the most of the industry's leading data warehouse.
This book will onboard you to Snowflake and present best practices for deploying and using the Snowflake data warehouse. The book also covers modern analytics architecture, integration with leading analytics software such as Matillion ETL, Tableau, and Databricks, and migration scenarios for on-premises legacy data warehouses.
This new edition includes expanded coverage of SnowPark for developing complex data applications, an introduction to managing large datasets with Apache Iceberg tables, and instructions for creating interactive data applications using Streamlit, ensuring readers are equipped with the latest advancements in Snowflake's capabilities.
What You Will Learn
- Master key functionalities of Snowflake
- Set up security and access with cluster
- Bulk load data into Snowflake using the COPY command
- Migrate from a legacy data warehouse to Snowflake
- Integrate the Snowflake data platform with modern business intelligence (BI) and data integration tools
- Manage large datasets with Apache Iceberg Tables
- Implement continuous data loading with Snowpipe and Dynamic Tables
Who This Book Is For
Data professionals, business analysts, IT administrators, and existing or potential Snowflake users
商品描述(中文翻譯)
這本書是您進入現代數據分析平台市場的指南,並介紹使用為雲端而建的數據倉庫 Snowflake 的好處。隨著組織越來越依賴現代雲端數據平台,任何分析框架的核心——數據倉庫——變得比以往任何時候都更為重要。本書的更新版第二版確保您能充分利用業界領先的數據倉庫。
本書將引導您了解 Snowflake,並介紹部署和使用 Snowflake 數據倉庫的最佳實踐。本書還涵蓋了現代分析架構、與領先的分析軟體(如 Matillion ETL、Tableau 和 Databricks)的整合,以及從本地舊有數據倉庫的遷移情境。
這一新版包括擴展的 SnowPark 覆蓋範圍,用於開發複雜的數據應用程式,介紹如何使用 Apache Iceberg 表管理大型數據集,以及使用 Streamlit 創建互動式數據應用程式的指導,確保讀者掌握 Snowflake 最新的功能進展。
您將學到的內容:
- 精通 Snowflake 的關鍵功能
- 使用集群設置安全性和訪問權限
- 使用 COPY 命令批量加載數據到 Snowflake
- 從舊有數據倉庫遷移到 Snowflake
- 將 Snowflake 數據平台與現代商業智慧(BI)和數據整合工具整合
- 使用 Apache Iceberg 表管理大型數據集
- 實現使用 Snowpipe 和動態表的持續數據加載
本書適合對象:
數據專業人士、商業分析師、IT 管理員,以及現有或潛在的 Snowflake 使用者。
作者簡介
作者簡介(中文翻譯)
Dmitry Anoshin 是一位以數據為中心的技術專家,並且在建立和實施商業/數位智慧解決方案方面擁有 14 年的經驗,曾在北美和歐洲的商業智慧、數據倉儲與數據整合、大數據、雲端及機器學習領域工作。他在多個行業(如零售、金融、行銷和電子商務)成功實施了分析專案,並持續領導數據工程計畫,目前正在開發一個使用雲端和大數據技術構建的 petabyte 級數據平台。該平台旨在支持機器學習實驗、數據科學模型、商業智慧報告以及與內部和外部夥伴的數據交換,同時處理隱私合規和安全關鍵的數據集。他還在維多利亞大學教授雲端計算課程,指導高中生,並在 Surfalytics.com 幫助人們從零開始規劃他們的數據職業生涯。
Dmitry Foshin 是一位首席數據工程師,擁有超過 12 年的 IT 和大數據經驗。他專注於通過熟練的數據工程、分析和可視化提供商業洞察。他擅長領導和執行全棧的大數據分析解決方案,從 ETL 流程到數據倉儲,利用雲端技術和現代商業智慧工具。作為 Azure Data Factory Cookbook 的共同作者,Dmitry 為多家領先的國際企業啟動了成功的數據分析專案。
Donna Strok 熱愛所有與數據相關的事物,並在 Expedia Group、JPMorgan Chase 和 Amazon 等公司工作了超過 10 年。她獲得了計算機科學學士學位和計算機資訊系統碩士學位。她與她的貓 Dwayne Johnson 住在美麗的西雅圖,並在空閒時間享受環遊世界的樂趣。她總是尋找探索獨特的雜貨店和驚人的小餐館,並在那裡享用過一些最難忘的美食。