買這商品的人也買了...
-
Vim 實用技巧, 2/e (Practical Vim : Edit Text at the Speed of Thought, 2/e)$354$336 -
$294JavaScript設計模式 -
Effective C# 中文版 | 寫出良好 C# 程式的 50個具體做法, 3/e (Effective C# : 50 Specific Ways to Improve Your C#(Covers C# 6.0), 3/e)$450$356 -
React 入門開發實務$520$411 -
演算法圖鑑:26種演算法 + 7種資料結構,人工智慧、數據分析、邏輯思考的原理和應用 step by step 全圖解$450$356 -
忍者:JavaScript 開發技巧探秘, 2/e (Secrets of the JavaScript Ninja, 2/e)$650$507 -
$474Anaconda 數據科學實戰 -
Towards Tensorflow 2.0:無痛打造AI模型(iT邦幫忙鐵人賽系列書)$500$390 -
Azure DevOps 顧問實戰$500$395
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書採用理論與案例相結合的形式,以Anaconda為主要開發工具,系統、全面地介紹了Python數據分析的相關知識。
全書共分為9章,
第1章介紹了數據分析的基本概念,以及開發工具的安裝和使用;
第2~6章介紹了Python數據分析的常用庫及其應用,涵蓋了科學計算庫NumPy、
數據分析庫Pandas、數據可視化庫Matplotlib、Seaborn與Bokeh;
第7、8章主要介紹了時間序列和文本數據的分析;
第9章結合之前所學的技術開發了一個綜合案例,演示如何在項目中運用所學的知識。
除了第1章外,其他章節都包含了很多示例和綜合案例,
通過動手操作和練習,可以幫助讀者更好地理解和掌握所學的知識。
本書適合作為高等院校計算機相關專業的大數據技術類課程教材,
也可以作為大數據技術愛好者入門用書。
作者簡介
江蘇傳智播客教育科技股份有限公司(簡稱傳智播客)是一家專門致力於高素質軟件開發人才培養的高科技公司。
“黑馬程序員”是傳智播客旗下高端IT教育品牌。
目錄大綱
目錄
第1章數據分析概述1
1.1數據分析的背景1
1.2什麼是數據分析2
1.3數據分析的應用場景2
1.4數據分析的流程3
1.5為什麼選擇Python做數據分析4
1.6創建新的Python環境——Anaconda 5
1.6.1 Anaconda發行版本概述5
1.6.2在Windows系統中安裝Anaconda 5
1.6.3通過Anaconda管理Python包7
1.7啟用Jupyter Notebook 9
1.7.1啟動Anaconda自帶的Jupyter Notebook 9
1.7.2 Jupyter Notebook界面詳解10
1.7.3 Jupyter Notebook的基本使用13
1.8常見的數據分析工具16
小結17
習題17
第2章科學計算庫NumPy 19
2.1認識NumPy數組對象19
2.2創建NumPy數組21
2.3 ndarray對象的數據類型22
2.3.1查看數據類型22
2.3.2轉換數據類型23
2.4數組運算24
2.4.1矢量化運算24
2.4.2數組廣播25
2.4.3數組與標量間的運算25
2.5 ndarray的索引和切片26
2.5.1整數索引和切片的基本使用26
2.5.2花式(數組)索引的基本使用28
2.5.3布爾型索引的基本使用29
2.6數組的轉置和軸對稱30
2.7 NumPy通用函數32
2.8利用NumPy數組進行數據處理34
2.8.1將條件邏輯轉為數組運算34
2.8.2數組統計運算34
2.8.3數組排序35
2.8.4檢索數組元素36
2.8.5唯一化及其他集合邏輯36
2.9線性代數模塊37
2.10隨機數模塊38
2.11案例——酒鬼漫步39
小結40
習題40
第3章數據分析工具Pandas 42
3.1 Pandas的數據結構分析42
3.1.1 Series 42
3.1.2 DataFrame 44
3.2 Pandas索引操作及高級索引46
3.2.1索引對象46
3.2.2重置索引47
3.2.3索引操作49
3.3算術運算與數據對齊53
3.4數據排序54
3.4.1按索引排序54
3.4.2按值排序55
3.5統計計算與描述56
3.5.1常用的統計計算57
3.5.2統計描述58
3.6層次化索引59
3.6.1認識層次化索引59
3.6.2層次化索引的操作64
3.7讀寫數據操作68
3.7.1讀寫文本文件68
3.7.2讀寫Excel文件70
3.7.3讀取HTML表格數據72
3.7. 4讀寫數據庫73
3.8案例——北京高考分數線統計分析77
2.8.1案例需求77
2.8.2數據準備77
2.8.3功能實現78
小結81
習題81
第4章數據預處理83
4.1數據清洗83
4.1. 1空值和缺失值的處理83
4.1.2重複值的處理88
4.1.3異常值的處理90
4.1.4更改數據類型94
4.2數據合併96
4.2.1軸向堆疊數據96
4.2.2主鍵合併數據99
4.2.3根據行索引合併數據103
4.2.4合併重疊數據105
4.3數據重塑106
4.3.1重塑層次化索引106
4.3.2軸向旋轉109
4.4數據轉換110
4.4. 1重命名軸索引110
4.4.2離散化連續數據112
4.4.3啞變量處理類別型數據113
4.5案例——預處理部分地區信息115
4.5.1案例需求115
4.5.2數據準備115
4.5.3功能實現116
小結123
習題123
第5章數據聚合與分組運算125
5.1分組與聚合的原理125
5.2通過groupby()方法將數據拆分成組126
5.3數據聚合132
5.3.1使用內置統計方法聚合數據132
5.3 .2面向列的聚合方法132
5.4分組級運算136
5.4.1數據轉換136
5.4.2數據應用138
5.5案例——運動員信息的分組與聚合141
5.5.1案例需求141
5.5.2數據準備141
5.5.3功能實現142
小結146
習題147
第6章數據可視化149
6.1數據可視化概述149
6.1.1什麼是數據可視化149
6.1.2常見的圖表類型150
6.1.3數據可視化的工具154
6.2 Matplotlib——繪製圖表155
6.2.1通過figure()函數創建畫布155
6.2.2通過subplot()函數創建單個子圖157
6.2.3通過subplots()函數創建多個子圖158
6.2.4通過add_subplot()方法添加和選中子圖160
6.2.5添加各類標籤161
6.2.6繪製常見圖表162
6.2.7本地保存圖形167
6.3 Seaborn——繪製統計圖形168
6.3.1可視化數據的分佈168
6.3.2用分類數據繪圖174
6.4 Bokeh——交互式可視化庫178
6.4.1認識Bokeh庫178
6.4.2通過Plotting繪製圖形179
6.5案例——畫圖分析某年旅遊景點數據180
6.5.1案例需求181
6.5.2數據準備181
6.5.3功能實現181
小結185
習題185
第7章時間序列分析187
7.1時間序列的基本操作187
7.1.1創建時間序列187
7.1.2通過時間戳索引選取子集189
7.2固定頻率的時間序列191
7.2 .1創建固定頻率的時間序列191
7.2.2時間序列的頻率、偏移量193
7.2.3時間序列的移動195
7.3時間週期及計算196
7.3.1創建時期對象196
7.3.2時期的頻率轉換198
7.4重採樣198
7.4.1重採樣方法(resample) 199
7.4.2降採樣200
7.4.3升採樣201
7.5數據統計——滑動窗口203
7.6時序模型——ARIMA 206
7.7案例——股票收盤價分析207
7.7.1案例需求207
7.7.2數據準備207
7.7.3功能實現208
小結213
習題214
第8章文本數據分析216
8.1文本數據分析工具216
8.1.1 NLTK與jieba概述216
8.1.2安裝NLTK和下載語料庫217
8.1.3 jieba庫的安裝219
8.2文本預處理220
8.2.1預處理的流程220
8.2.2分詞221
8.2.3詞性標註223
8.2 .4詞形歸一化224
8.2.5刪除停用詞226
8.3文本情感分析227
8.4文本相似度229
8.5文本分類232
8.6案例——商品評價分析235
8.6.1案例需求235
8.6.2數據準備236
8.6.3功能實現236
小結240
習題240
第9章數據分析實戰——北京租房數據統計分析242
9.1數據來源242
9.2數據讀取243
9.3數據預處理244
9.3.1重複值和空值處理244
9.3. 2數據轉換類型246
9.4圖表分析247
9.4.1房源數量、位置分佈分析248
9.4.2戶型數量分析255
9.4.3平均租金分析258
9.4.4面積區間分析260
小結262
