人人可懂的數據科學

(愛爾蘭)約翰·D. 凱萊赫(John D. Kelleher),(愛爾蘭)布倫丹·蒂爾尼(Brendan Tierney)著

立即出貨

買這商品的人也買了...

商品描述

本書從數據科學發展演化史,數據科學定義,數據、數據集,數據科學生態系統,機器學習,數據科學標準任務,隱私與倫理,發展趨勢等角度,對數據科學展開了精彩的闡述。

本書精準界定了數據科學的術語、任務、生命周期,並介紹了主流的數據科學生態技術,及決策樹、回歸分析、神經網絡、深度學習等常見機器學習算法。同時也涵蓋隱私、數據倫理等方面的話題,介紹了數據科學可能引發的隱私泄露、人為歧視、不公平,以及歐盟、美國等國家或地區針對數據因素保護、數據倫理的立法。

數據科學是什麽?
數據科學是如何發展演化的?
數據科學項目的標準流程是什麽?
數據基礎設施面臨的挑戰有哪些?
數據科學與機器學習有什麽關系?
在數據科學過程中如何進行數據監管和保護個人隱私?
數據科學項目成功的重要原則是什麽?
數據科學的未來影響是什麽?

如今,數據科學推動了現代社會幾乎所有領域決策的發展,正在影響著人們日常生活的方方面面。本書旨在闡述理解數據科學所需的基本思想和概念,幫助你理解什麽是數據科學,它是如何工作的,以及它能(和不能)做什麽。

作者簡介

[愛爾蘭]約翰· D.凱萊赫(John D. Kelleher),布倫丹·蒂爾尼(Brendan Tierney)著:

約翰· D.凱萊赫(John D. Kelleher)是都柏林理工學院計算機科學學院的教授以及信息、通信和娛樂研究所的學術負責人。他的研究得到了ADAPT中心的支持,該中心由愛爾蘭科學基金會(Grant 13 / RC / 2106)資助,同時也接受歐洲區域發展基金的資助。他還是《Fundamentals of Machine Learning for Predictive Data Analytics》的作者之一。

布倫丹·蒂爾尼(Brendan Tierney)是都柏林理工學院計算機科學學院的講師,同時也是Oracle ACE主任,還著有多本基於Oracle技術的數據挖掘類著作。

目錄大綱

譯者序
前言
致謝
作者簡介
 

第1章什麼是數據科學
1.1數據科學簡史
1.1.1數據收集簡史
1.1.2數據分析簡史
1.1.3數據科學的產生與發展
1.2數據科學用於何處
1.2.1銷售和營銷中的數據科學
1.2.2數據科學在政府中的應用
1.2.3數據科學在競技體育中的應用
1.3為什麼是現在
1.4關於數據科學的神話
 

第2章什麼是數據,什麼是數據集
2.1關於數據的觀點
2.2數據可以積累,而智慧不能
2.3 CRISP-DM
 

第3章數據科學生態系統
3.1將算法遷移至數據
3.1.1傳統數據庫與現代的傳統數據庫
3.1.2大數據架構
3.1.3混合數據庫世界
3.2數據準備和集成
 

第4章機器學習
4 .1有監督學習與無監督學習
4.2學習預測模型
4.2.1相關性不等同於因果,但它有時非常有用
4.2.2線性回歸
4.2.3神經網絡與深度學習
4 .2.4決策樹
4.3數據科學中的偏差
4.4評估模型:泛化而不是記憶
4.5摘要
 

第5章標準的數據科學任務
5.1誰是我們的目標客戶(聚類)
5.2這是欺詐嗎(異常值檢測)
5.3你要配份炸薯條嗎(關聯規則挖掘)
5.4流失還是不流失,這是一個問題(分類)
5.5它價值幾何(回歸)
 

第6章隱私與道德
6.1商業利益與個人隱私
6.1.1數據科學的道德啟示:畫像與歧視
6.1.2數據科學的道德含義:創建一個全景監獄
6.2隱私保護
6.2.1保護隱私的計算方法
6.2.2規範數據使用和保護隱私的法律框架
6 .3通往道德的數據科學之路
 

第7章未來趨勢與成功準則
7.1醫療數據科學
7.2智慧城市
7.3數據科學項目準則:為什麼會成功或失敗
7.4終極思考
 

術語表
延伸閱讀
參考文獻