Jupyter 數據科學實戰 Data Science with Jupyter: Master Data Science skills with easy-to-follow Python examples

Name: Jupyter 數據科學實戰
Price: 402 TWD
Availability: InStock
Author: Prateek Gupta
ISBN: 7115544395

Prateek Gupta 王珮瑤

預覽內頁

出版商: 人民郵電
出版日期: 2020-11-01
定價: $474
售價: 8.5 折 $402
語言: 簡體中文
頁數: 254
裝訂: 平裝
ISBN: 7115544395
ISBN-13: 9787115544391
相關分類: Python
此書翻譯自: Data Science with Jupyter: Master Data Science skills with easy-to-follow Python examples

立即出貨 (庫存 < 3)

買這商品的人也買了...

~~$280~~ $238

待辦事項這樣列，工作當場完成一半：只花兩分鐘、用五個詞，裝忙整理清單，你再也不會被「沒做完」追殺 (The Productivity Habits: A Simple Approach to Become More Productive)
$414

Spring Boot 2 + Thymeleaf 企業應用實戰
~~$330~~ $260

超成功對話術
~~$360~~ $306

揪出時間小偷的看板管理法：微軟、Zara、HP……這樣精實流程，免做虛工、省時有餘裕，部屬被動變主動。
~~$700~~ $665

工程數學學習要訣 (上), 18/e (適用: 理工所．大學自修)
~~$750~~ $638

NumPy 高速運算徹底解說 - 六行寫一隻程式？你真懂深度學習？手工算給你看！
~~$700~~ $665

工程數學學習要訣 (下), 18/e (適用: 理工所．大學自修)
$453

原子教你玩 FPGA：基於 Intel Cyclone IV
~~$420~~ $357

2030 世界未來報告書：區塊鏈、AI、生技與新能源革命、產業重新洗牌，接下來10年的工作與商機在哪裡？
~~$520~~ $410

Python 大數據特訓班：資料自動化收集、整理、清洗、儲存、分析與應用實戰, 2/e (附300分鐘影音教學/範例程式)
~~$500~~ $250

Towards Tensorflow 2.0：無痛打造AI模型（iT邦幫忙鐵人賽系列書）
$374

Python 數據分析
$499

時間序列分析與預測
$374

強化學習入門：從原理到實踐
$453

Python 遷移學習
~~$590~~ $466

30分鐘就讀懂：機器學習從數學開始
$504

Jupyter Notebook 數據分析入門與實戰
~~$480~~ $408

跨領域學 Python：資料科學基礎養成
$126

Bootstrap 響應式 Web 開發
$402

場景化機器學習
$708

輕量級 Java EE 企業應用開發實戰
$1,080

PostgreSQL Query Optimization: The Ultimate Guide to Building Efficient Queries (Paperback)
~~$880~~ $695

500個必問題：深度學習 AI頂尖企業面試實況
~~$479~~ $455

Jupyter 入門與實戰
~~$880~~ $616

機器學習演算法動手硬幹：用 PyTorch + Jupyter 最佳組合達成 (特價書)

商品描述

本書旨在成為讀者進入數據科學領域的指南。
全書共20章，涵蓋了數據科學及其應用的各個方面，
引入經典數據集將理論與實踐相結合，採用Jupyter等工具，
以Python語言由淺入深地介紹了數據科學及相關學科的基本概念、
數據預處理、機器學習及時間序列等內容，並提供了不同的案例研究，
以達到學以致用的效果。通過閱讀本書，
讀者將獲得成為一名數據科學家所需的基本知識和技能。

本書適合有Python或其他編程語言基礎，並對數據科學感興趣的人員閱讀。

作者簡介

Prateek Gupta

是一位有著超過6年工作經驗的數據科學專業人士，
曾在HCL、Zensar和Sapient等多家跨國IT巨頭就職，
其專業領域主要是尋找模式、運用先進統計方法和算法揭示隱藏的規律，
力爭最大限度地提高企業收入和盈利能力，並確保高效的運營管理。

他是一位具有主觀能動性並且在電子商務領域頗有建樹的忠實數據愛好者，
還憑藉自己在商品自動分類、情感分析、
客戶細分和推薦引擎方面的機器學習專業知識幫助了NTUC Singapore和Times Group India等多個客戶。
他秉持著這一理念：“當天才放棄努力時，勤奮將超越天賦”。

他感興趣的是有關機器學習和自然語言處理在各個行業的應用的前沿研究領域。
閒暇時，他喜歡通過自己的博客分享知識，並激勵年輕人進入令人興奮的數據科學世界。

目錄大綱

第 1章　數據科學基本概念　1
1.1　數據的概念　2
1.1.1　結構化數據　2
1.1.2　非結構化數據　2
1.1.3　半結構化數據　3
1.2　數據科學的定義　3
1.3　數據科學家的工作　4
1.4　數據科學應用實例　5
1.5　為何Python適合數據科學　6
1.6　小結　7

第　2章軟件安裝與配置　8
2.1　系統要求　9
2.2　下載Anaconda　9
2.3　在Windows系統上安裝Anaconda　10
2.4　在Linux系統上安裝Anaconda　11
2.5　如何在Anaconda中安裝新的Python庫　13
2.6　打開筆記本—Jupyter　14
2.7　瞭解筆記本　15
2.8　小結　19

第3章　列表與字典　20
3.1　什麼是列表　21
3.2　如何創建列表　21
3.3　列表的不同操作　22
3.4　列表與數組的差異　25
3.5　什麼是字典　26
3.6　如何創建字典　26
3.7　字典的相關操作　26
3.8　小結　28

第4章　函數與包　29
4.1　Python的Help()函數　30
4.2　如何導入Python包　30
4.3　如何創建並調用函數　31
4.4　在函數中傳遞參數　31
4.5　函數的默認參數　32
4.6　如何在函數中使用未知參數　32
4.7　函數的全局與本地變量　33
4.8　Lambda函數　35
4.9　瞭解Python中的main方法　35
4.10　小結　38

第5章　NumPy基本概念　39
5.1　導入NumPy包　39
5.2　為何NumPy數組優於列表　40
5.3　NumPy數組屬性　41
5.4　創建NumPy數組　41
5.5　訪問NumPy數組中的元素　43
5.6　NumPy數組的切片　44
5.7　數組連接　46
5.8　小結　47

第6章　Pandas和數據幀　48
6.1　導入Pandas　48
6.2　Pandas數據結構　49
6.3　.loc[]和.iloc[]　54
6.4　一些有用的數據幀函數　55
6.5　處理數據幀中的缺失值　57
6.6　小結　60

第7章　與數據庫交互　61
7.1　SQLAlchemy　62
7.2　安裝SQLAlchemy包　62
7.3　如何使用SQLAlchemy　63
7.4　SQLAlchemy引擎配置　64
7.5　在數據庫中新建表　65
7.6　在表中插入數據　66
7.7　更新記錄　67
7.8　如何合並表格　68
7.8.1　內連接　68
7.8.2　左連接　69
7.8.3　右連接　70
7.9　小結　70

第8章　數據科學中的統計思維　71
8.1　數據科學中的統計學　72
8.2　統計數據/變量的類型　72
8.3　平均數、中位數和眾數　73
8.4　概率的基本概念　74
8.5　統計分佈　75
8.6　Pearson相關系數　77
8.7　概率密度函數　78
8.8　真實案例　79
8.9　統計推斷與假設檢驗　79
8.10　小結　86

第9章　如何在Python中導入數據　87
9.1　導入TXT數據　88
9.2　導入CSV數據　89
9.3　導入Excel數據　90
9.4　導入JSON數據　90
9.5　導入腌制數據　91
9.6　導入壓縮數據　91
9.7　小結　92

第　10章清洗導入的數據　93
10.1　瞭解數據　94
10.2　分析缺失值　95
10.3　丟棄缺失值　97
10.4　自動填充缺失值　98
10.5　如何縮放和歸一化數據　99
10.6　如何解析日期　102
10.7　如何應用字符編碼　104
10.8　清洗不一致的數據　105
10.9　小結　106

第　11章數據可視化　107
11.1　條形圖　108
11.2　折線圖　109
11.3　直方圖　110
11.4　散點圖　111
11.5　堆積圖　111
11.6　箱線圖　113
11.7　小結　115

第　12章數據預處理　116
12.1　關於案例研究　116
12.2　導入數據集　117
12.3　探索性數據分析　118
12.4　數據清洗與預處理　122
12.5　特徵工程　124
12.6　小結　129

第　13章監督式機器學習　130
13.1　常見的機器學習術語　131
13.2　機器學習導論　132
13.3　常用機器學習算法列述　133
13.4　監督式機器學習基礎　134
13.5　解決分類機器學習問題　136
13.6　為何要進行訓練/測試拆分和交叉驗證　140
13.7　解決回歸機器學習問題　144
13.8　如何調整機器學習模型　152
13.9　如何處理sklearn中的分類變量　154
13.10　處理缺失數據的高級技術　155
13.11　小結　158

第　14章無監督式機器學習　159
14.1　為何選擇無監督式機器學習　160
14.2　無監督式機器學習技術　160
14.2.1　聚類　161
14.2.2　主成分分析　169
14.3　案例研究　172
14.4　驗證無監督式機器學習　178
14.5　小結　179

第　15章處理時間序列數據　180
15.1　為何時間序列重要　181
15.2　如何處理日期和時間　181
15.3　轉換時間序列數據　184
15.4　操作時間序列數據　187
15.5　比較時間序列的增長率　189
15.6　如何改變時間序列頻率　192
15.7　小結　198

第　16章時間序列法　199
16.1　時間序列預測的定義　200
16.2　預測的基本步驟　200
16.3　時間序列預測的技術　201
16.3.1　自回歸　201
16.3.2　移動平均　202
16.3.3　自回歸移動平均　203
16.3.4　自回歸積分移動平均　203
16.3.5　季節性自回歸積分移動平均　204
16.3.6　季節性自回歸積分移動平均與外生回歸因子　205
16.3.7　向量自回歸移動平均　205
16.3.8　Holt-Winters指數平滑　206
16.4　預測網頁的未來流量　207
16.5　小結　214

第　17章案例研究1　215
第　18章案例研究2　230
第　19章案例研究3　239
第　20章案例研究4　247