Python 數據科學基礎與實踐
王仁武
- 出版商: 人民郵電
- 出版日期: 2021-11-01
- 定價: $419
- 售價: 7.9 折 $331
- 語言: 簡體中文
- 頁數: 308
- 裝訂: 平裝
- ISBN: 7115556091
- ISBN-13: 9787115556097
-
相關分類:
Python、DeepLearning
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$250Python 數據挖掘方法及應用 -
$454Python 科學計算及實踐 -
$454SaaS 商業實戰:好模式如何變成好生意 -
$305機器學習入門與實戰 — 基於 scikit-learn 和 Keras -
$331集成學習入門與實戰:原理、算法與應用 -
$276雲計算應用開發(初級) -
$659Python 統計可視化之 Altair 探索分析實踐指南 -
$551雲端架構:基於雲平臺的 41種可復用的架構最佳實踐 -
非線性系統, 3/e (Nonlinear Systems, 3/e)$894$849 -
$356數據科學方法與實踐 ——基於 Python 技術實現 -
TensorFlow Lite 移動端深度學習$654$621 -
$403動手學 PyTorch 深度學習建模與應用 -
深度強化學習算法與實踐:基於 PyTorch 的實現$648$616 -
$473智能前端技術與實踐 -
$387從 ChatGPT 到 AIGC:智能創作與應用賦能 -
$662Amazon Web Services 雲計算實戰, 2/e -
$469精通 Transformer : 從零開始構建最先進的 NLP 模型 -
$658高級 Python 核心編程開啟精通 Python 編程世界之旅 -
$505python核心編程:從入門到實踐:學與練 -
$560Python 開發實例大全 上捲 -
$560Python 開發實例大全 下捲 -
$564前端工程化 : 基於 Vue.js 3.0 的設計與實踐 -
$356實用黑客攻防技術 -
Kali Linux 滲透測試全流程詳解$599$569 -
穿越作業系統迷霧:從零實現作業系統$594$564
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
85折
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$544 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
簡體中文年末書展 詳見活動內容 »
-
VIP 95折
JavaScript 高級程序設計, 5/e (Professional JavaScript for Web Developers, 5/e)$959$911 -
VIP 95折
Windows 網絡編程, 2/e$354$336 -
79折
$327視覺語言:人人皆可表達的一種語言 -
VIP 95折
自然語言理解與行業知識圖譜:概念、方法與工程落地$714$678 -
79折
$327深入理解 RISC-V 程序開發 -
VIP 95折
軟件估算的藝術$414$393 -
VIP 95折
Vivado 入門與 FPGA 設計實例$390$371 -
79折
$559IP 路由協議疑難解析 -
85折
$403深入淺出電腦網絡(微課視頻版)(第2版) -
79折
$426基於 HyperWorks 和 LS-DYNA 的有限元分析實用教程 (視頻教學) -
70折
$370視頻師:深入學習視音頻編輯(EDIUS實戰版) -
VIP 95折
流體動畫引擎開發:理論與實踐$594$564 -
VIP 95折
Windows 信息安全和網絡攻防$654$621 -
79折
$426Python 算法交易實戰 -
VIP 95折
Maven 實戰$390$371 -
VIP 95折
Web 安全應用與防護$354$336 -
VIP 95折
Spring Boot 項目開發實踐 (微視頻版)$594$564 -
VIP 95折
星地融合移動通信系統與關鍵技術從5G NTN到6G的衛星因特網發展$1,139$1,082 -
VIP 95折
零基礎學 Python GUI 設計:tkinter (升級版)$594$564 -
85折
$500SAP ERP 公有雲實務教程 -
79折
$422高效研發:矽谷研發效能方法與實踐 -
VIP 95折
Power BI 權威指南$474$450 -
VIP 95折
遊戲機制 — 高級遊戲設計技術 (Game Mechanics: Advanced Game Design)$719$683 -
79折
$426遊戲人工智能編程案例精粹 (修訂版) (Programming Game AI by Example) -
79折
$284Audition 2022 全面精通:錄音剪輯 + 消音變調 + 配音製作 + 唱歌後期 + 案例實戰
相關主題
商品描述
本書使用數據科學領域中流行的編程語言之一——Python 來進行數據的基本處理與可視化、數據獲取、數據分析、數據挖掘、文本挖掘和深度學習,旨在幫助讀者掌握從事數據科學工作的必備技能。
全書共 9 章,主要內容包括數據科學概述、Python 基礎知識、Python 數據科學常用庫、Python 數據獲取、Python 數據分析、Python 數據挖掘、Python 文本挖掘、深度學習基礎和深度學習應用。
本書可作為普通高等院校數據科學與大數據技術、大數據應用與管理等專業相關課程的教材,也可作為數據分析從業人員的參考書。
作者簡介
王仁武,男,工科博士、副教授,現華東師範大學信息學系教師,主要研究方向數據分析、數據挖掘與文本挖掘、機器學習與深度學習等。
目錄大綱
第 1章 數據科學概述 1
1.1 什麼是數據科學 1
1.2 如何學習數據科學 2
1.3 什麼是數據科學家 2
1.4 數據科學家需要掌握的技能 3
1.5 Python與數據科學 3
1.6 數據科學領域常用的Python包 4
1.7 時代寵兒—深度學習 6
習題 6
第 2章 Python基礎知識 7
2.1 Python介紹 7
2.1.1 Jupyter Notebook的簡介及使用 8
2.1.2 Python基礎概念 10
2.1.3輸入和輸出 14
2.1.4運算符 15
2.2 常見數據結構和基本語句 17
2.2.1序列 17
2.2.2字典 23
2.2.3集合 27
2.2.4基本語句 29
2.3 函數和模塊 32
2.3.1函數 32
2.3.2模塊 38
2.4 異常處理 43
2.4.1什麼是異常 43
2.4.2常見異常錯誤 43
2.4.3捕捉異常 44
2.4.4觸發異常 45
2.5 文件讀寫 45
2.5.1編碼 45
2.5.2讀取文本文件 46
2.5.3 Word文件與Excel文件讀取 51
2.6 Pythonic 51
2.6.1解析式 52
2.6.2三元表達式 53
2.6.3花樣傳參:zip與星號操作 54
本章小結 56
習題 56
第3章 Python數據科學常用庫 58
3.1 Python數據分析概述 58
3.2 Numpy數值計算 59
3.2.1 Numpy基礎簡介 59
3.2.2 Numpy基礎用法簡介 60
3.2.3 Numpy數據分析常用函數簡介 73
3.3 Pandas基礎知識 76
3.3.1 Series介紹及其基本操作 76
3.3.2 DataFrame介紹及其基本操作 79
3.4 Pandas數據預處理 82
3.4.1數據合併 82
3.4.2 數據清洗 86
3.4.3 數據標準化 88
3.4.4 數據轉換 89
3.5 Pandas數據分析基礎 92
3.5.1 分層索引 92
3.5.2 Pandas常用函數介紹 97
3.5.3 分組 98
3.5.4 整形和旋轉 100
3.5.5 數據透視表和交叉表 104
3.6 Matplotlib數據可視化 108
3.6.1 Matplotlib簡介 108
3.6.2 Matplotlib繪圖基礎簡介 109
3.6.3 常用統計圖繪製簡介 113
本章小結 116
習題 116
第4章 Python數據獲取 118
4.1 數據及其類型 119
4.1.1 屬性與屬性類型 119
4.1.2 數據類型 120
4.1.3 數據集的類型 121
4.2 數據獲取方法 124
4.2.1 從文件中獲取數據 124
4.2.2 從數據庫中獲取數據 130
4.2.3 從網絡接口獲取數據 133
4.2.4 從網頁抓取數據 135
4.3 網絡爬蟲 135
4.3.1 爬蟲簡介及爬蟲流程 135
4.3.2 發起請求 136
4.3.3 獲取響應內容 138
4.3.4 解析內容 139
4.3.5 Selenium 144
本章小結 147
習題 147
第5章 Python數據分析 149
5.1數據分析基礎 150
5.1.1 對比分析 151
5.1.2 分組分析 152
5.1.3 結構分析 153
5.1.4 分佈分析 153
5.1.5 交叉分析 155
5.2 描述性統計分析 156
5.2.1 數據集中趨勢分析 156
5.2.2 數據的離散程度分析 157
5.2.3 數據的分佈形態分析 159
5.2.4 相關分析 160
5.2.5 基於Seaborn的數據可視化分析 161
5.3 主成分分析 164
5.3.1 主成分分析原理介紹 164
5.3.2 主成分分析基本流程 165
5.3.3 Python實現主成分分析 166
5.4 回歸分析 171
5.4.1 簡單線性回歸分析 172
5.4.2 多元線性回歸分析 177
本章小結 181
習題 181
第6章 Python數據挖掘 183
6.1 Python數據挖掘概述 183
6.1.1 數據挖掘分類及常用方法 184
6.1.2 使用Scikit-learn構建數據挖掘模型 186
6.2 分類預測:決策樹算法 193
6.2.1 分類算法概述 193
6.2.2 決策樹算法 194
6.2.3 決策樹分枝 195
6.2.4 決策樹剪枝 198
6.2.5 分類算法評估 199
6.2.6 決策樹的Python實現 200
6.3樸素貝葉斯(Naive Bayesian) 202
6.3.1 貝葉斯簡介 202
6.3.2 構建樸素貝葉斯模型 203
6.3.3 樸素貝葉斯的Python實現 204
6.4 人工神經網絡 205
6.4.1 人工神經網絡簡介 205
6.4.2 神經元與激活函數 207
6.4.3 前饋神經網絡 211
6.4.4 反向傳播機制 212
6.4.5 神經網絡的Python實現 215
6.5集成學習 220
6.5.1 集成學習簡介 220
6.5.2 裝袋法的代表——隨機森林 223
6.5.3 boosting的代表——xgboost 230
6.6 關聯分析(Association analysis) 232
6.6.1 關聯分析概述 232
6.6.2 Apriori算法 235
6.6.3 FP-Growth算法 238
6.6.4 關聯規則的Python實現 239
6.7 聚類分析 242
6.7.1 聚類分析概述 242
6.7.2 常用聚類算法 243
6.7.3 聚類算法Python實現 249
本章小結 252
習題 252
第7章 文本挖掘 254
7.1 文本挖掘概述 254
7.1.1 文本挖掘的定義 254
7.1.2 Python中的文本挖掘包 255
7.1.3 文本挖掘的過程 255
7.1.4 文本挖掘的應用 256
7.2 Python文本特徵提取 256
7.2.1 中文分詞與詞雲 256
7.2.2 特徵詞量化與文本特徵提取 260
7.2.3 文本表示 262
7.3文本分類 268
7.3.1 文本分類概述 268
7.3.2文本分類的Python實現 269
7.4文本情感分析 271
7.4.1 情感分析概述 271
7.4.2 情感分析的具體應用及示例 273
7.5 LDA主題模型 275
7.5.1主題模型簡介 276
7.5.2主題模型在文本語義挖掘的應用 280
本章小結 282
習題 283
第8章 深度學習基礎 284
8.1 深度學習概述 284
8.1.1機器學習與深度學習 284
8.1.2 深度學習的發展 285
8.1.3 深度學習框架 286
8.2 PyTorch介紹與安裝 287
8.2.1 PyTorch介紹 287
8.2.2 PyTorch安裝 287
8.3 PyTorch基礎 288
8.3.1 Tensor張量 288
8.3.2 Variable變量 289
8.3.3 優化器 290
8.3.4 PyTorch與Numpy 290
8.4 捲積神經網絡 292
8.4.1捲積神經網絡簡介 292
8.4.2 二維捲積運算的運算基礎 293
8.4.3 二維捲積運算的填充與步長 295
8.4.4 三維捲積運算 296
8.4.5 其他捲積神經網絡組件 298
8.5 循環神經網絡 301
8.5.1 RNN的結構 301
8.5.2 RNN存在的問題 304
8.5.3 LSTM 304
8.5.4 GRU 305
8.6 CNN與RNN的PyTorch實現 306
8.6.1 捲積層 306
8.6.2 池化層 307
8.6.3 全連接層 308
8.6.4 RNN 308
8.6.5 LSTM 309
8.6.6 GRU 310
本章小結 310
習題 310
第9章 深度學習應用 313
9.1 圖片分類與遷移學習 313
9.1.1 遷移學習與傳統模型 313
9.1.2 圖片分類的經典案例 315
9.1.3 PyTorch實現DenseNet 317
9.2 命名實體識別 321
9.2.1 命名實體識別基礎 321
9.2.2 PyTorch實現命名實體識別 325
本章小結 330
習題 331
參考文獻 332


