Fuzzy Data Matching with SQL: Enhancing Data Quality and Query Performance (Paperback)
暫譯: 使用 SQL 進行模糊數據匹配:提升數據質量與查詢性能 (平裝本)
Lehmer, Jim
買這商品的人也買了...
-
JavaScript 大全, 6/e (JavaScript: The Definitive Guide: Activate Your Web Pages, 6/e)$1,200$948 -
王者歸來-jQuery 開發權威指南$720$612 -
輕鬆學會 LINE 程式設計與 AI 聊天機器人實作開發$520$406 -
影像辨識實務應用 -- 使用 C#$500$390 -
JavaScript 無所不在 (JavaScript Everywhere: Building Cross-Platform Applications with Graphql, React, React Native, and Electron)$580$458 -
白話演算法!培養程式設計的邏輯思考 (Grokking Algorithms: An illustrated guide for programmers and other curious people)$520$468 -
第一次用 Azure 雲端服務就上手$620$490 -
用 ASP.NET Core 打造軟體積木和應用系統$400$316 -
使用 Python 取代 Excel VBA 的 10堂課$520$411 -
LINE 聊天機器人 + AI + 雲端 + 開源 + 程式:輕鬆入門到完整學習$600$474 -
【圖解】從入門到精通 Excel ╳ Python 資料處理術:搭配工作實務場景,輕鬆學會除錯、擷取、排序、彙整指定數據,製作QR碼也沒問題$500$395 -
看完這本就會懂!帶你無痛提升 JavaScript 面試力:精選 55道前端工程師的核心問題 × 求職加分模擬試題解析$680$530 -
SQL 學習手冊|資料建立、維護與檢索, 3/e (Learning SQL: Generate, Manipulate, and Retrieve Data, 3/e)$620$490 -
Python 桌面開發王者 - Qt 6 全方位實例應用開發$1,200$948 -
快速精通 iOS 16 程式設計:從零開始活用 Swift 與 SwiftUI 開發技巧$760$593 -
圖解資料結構 × 演算法:運用 C#$600$468 -
快速精通 SwiftUI 框架:全面進化 SwiftUI 進階開發實戰技術$720$562 -
動手就能上手 - 看 Excel VBA 學 Python 資料處理自動化$880$695 -
哎呀!早知道就不會破版的 CSS 設計技巧:前端工程師防止佈局意外的必學密技(iThome鐵人賽系列書)【軟精裝】$660$515 -
圖像 Angular 開發入門:打造高靈活度的網頁應用程式【第二版】(iT邦幫忙鐵人賽系列書)$720$562 -
史上最強 Python 入門邁向頂尖高手之路王者歸來, 3/e (全彩印刷)$1,200$948 -
輕量又漂亮的 Python Web 框架 - Streamlit AI 時代非學不可$690$545 -
PHP 錦囊妙計 (PHP Cookbook: Modern Code Solutions for Professional Developers)$880$695 -
機器學習 : 最強入門邁向 AI 高手 王者歸來$1,080$853 -
Think Python|學習程式設計的思考概念, 3/e (Think Python: How to Think Like a Computer Scientist, 3/e)$720$569
相關主題
商品描述
If you were handed two different but related sets of data, what tools would you use to find the matches? What if all you had was SQL SELECT access to a database? In this practical book, author Jim Lehmer provides best practices, techniques, and tricks to help you import, clean, match, score, and think about heterogeneous data using SQL.
DBAs, programmers, business analysts, and data scientists will learn how to identify and remove duplicates, parse strings, extract data from XML and JSON, generate SQL using SQL, regularize data and prepare datasets, and apply data quality and ETL approaches for finding the similarities and differences between various expressions of the same data.
Full of real-world techniques, the examples in the book contain working code. You'll learn how to:
- Identity and remove duplicates in two different datasets using SQL
- Regularize data and achieve data quality using SQL
- Extract data from XML and JSON
- Generate SQL using SQL to increase your productivity
- Prepare datasets for import, merging, and better analysis using SQL
- Report results using SQL
- Apply data quality and ETL approaches to finding similarities and differences between various expressions of the same data
商品描述(中文翻譯)
如果你手上有兩組不同但相關的數據,你會使用什麼工具來尋找匹配項?如果你只有 SQL SELECT 的權限來訪問數據庫呢?在這本實用的書中,作者 Jim Lehmer 提供了最佳實踐、技術和技巧,幫助你使用 SQL 來導入、清理、匹配、評分以及思考異質數據。
資料庫管理員、程式設計師、商業分析師和數據科學家將學習如何識別和移除重複項、解析字串、從 XML 和 JSON 中提取數據、使用 SQL 生成 SQL、正規化數據和準備數據集,以及應用數據質量和 ETL 方法來尋找同一數據的不同表達之間的相似性和差異。
這本書充滿了現實世界的技術,書中的範例包含可運行的代碼。你將學會如何:
- 使用 SQL 識別和移除兩個不同數據集中的重複項
- 使用 SQL 正規化數據並達成數據質量
- 從 XML 和 JSON 中提取數據
- 使用 SQL 生成 SQL 以提高你的生產力
- 準備數據集以便導入、合併和更好的分析,使用 SQL
- 使用 SQL 報告結果
- 應用數據質量和 ETL 方法來尋找同一數據的不同表達之間的相似性和差異