Python 數據處理與挖掘
吳振宇 李春忠 李建鋒
買這商品的人也買了...
-
最新 AI 技術:知識圖譜集技術概念大成$980$774 -
資料視覺化設計:設計人最想學的視覺化魔法 ,將枯燥數據變成好看 好懂的圖表$480$408 -
$621AI 源碼解讀:機器學習案例 (Python版) -
$534AI 源碼解讀:循環神經網絡(RNN)深度學習案例 (Python版) -
$505基於混合方法的自然語言處理:神經網絡模型與知識圖譜的結合 -
$564AI 源碼解讀:捲積神經網絡(CNN)深度學習案例 (Python版) -
打好 AI 的基礎:一探機器學習底層數學運作$880$695 -
$450PyTorch 開發入門:深度學習模型的構建與程序實現 -
$374動手學推薦系統 — 基於 PyTorch 的算法實現 (微課視頻版) -
圖說演算法:使用 Python, 2/e【暢銷回饋版】$500$390 -
$352Python 深度強化學習 — 使用 PyTorch, TensorFlow 和 OpenAI -
Qt for Python PySide6 GUI 界面開發詳解與實例$708$673 -
Python 統計分析:生命科學應用 (An Introduction to Statistics with Python: With Applications in the Life Sciences)$500$390 -
凡人也能懂的白話人工智慧演算法 (Grokking Artificial Intelligence Algorithms)$580$435 -
一本精通 - LINE BOT + Python + Google Dialogflow 完整掌握 LINE BOT 的開發技巧 打造全方位 AI機器人$650$514 -
Python 資料結構×演算法 刷題鍛鍊班:234 題帶你突破 Coding 面試的難關$650$514 -
真槍實彈做專案:PyQt 極速開發視窗軟體, 2/e$880$695 -
Scikit-learn 詳解與企業應用:機器學習最佳入門與實戰$880$695 -
Excel × ChatGPT × Power Automate 自動化處理.效率提昇便利技$499$394 -
Python 量化投資指南 — 基礎、數據與實戰$588$559 -
$749PyTorch實戰 -
梯度提升算法實戰 — 基於 XGBoost和 scikit-learn$594$564 -
$473Python 金融量化實戰固定收益類產品分析 -
$510時間序列與機器學習 -
AI 繪圖邁向視覺設計$720$569
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
本書以構建完整的知識體系為目標,按照從簡單到復雜的思路,貫穿了數據處理與挖掘的各個環節,具體包括:Python快速入門、Python數據類型、Python常用模塊、Python數據獲取、Python數據挖掘基礎、Python數據挖掘算法、Python大數據挖掘和Python數據可視化。此外,針對各知識點,本書均設計了相應的Python案例,並給出了實現代碼、效果圖以及相應的解釋,以強化讀者對各知識點的理解與掌握。
本書可作為高等院校人工智能、電腦科學與技術、經濟與金融等專業的教材,也可供大數據分析與處理等領域的技術人員學習使用,還可作為數據分析與挖掘研究人員的參考用書。
作者簡介
【吳振宇】
北京航空航天大學工學博士,南京郵電大學物聯網學院教師,中國指揮與控制學會認知與行為專業委員會委員,中國電腦學會網絡與數據通信專業委員會委員。具有長達4年的外商投資企業軟件開發經驗,長期從事數據分析、人工智能、Linux編程等課程的教學工作。主要研究方向包括大數據分析與挖掘、智能駕駛等。
目錄大綱
第 1章 Python快速入門 1
1.1 一種簡單的編程語言 2
1.1.1 Python--解釋型編程語言 2
1.1.2 Python應用 3
1.2 Python開發環境 4
1.2.1 搭建簡單的Python開發環境 4
1.2.2 功能強大的集成開發環境 6
1.2.3 交互式開發環境 6
1.3 Python中簡單的程序結構 8
1.3.1 文件是代碼的基本組成單元 8
1.3.2 模塊化地組織代碼 8
1.3.3 代碼縮進區分邏輯關系 10
1.3.4 輸入和輸出提升程序交互性 10
1.3.5 常見的Python解釋器 11
1.4 習題 12
第 2章 Python數據類型 13
2.1 數據類型是數據表示的基礎 14
2.1.1 Python中一切皆對象 14
2.1.2 數字類型 14
2.1.3 布爾類型 15
2.1.4 字符串類型 15
2.1.5 自定義數據類型 16
2.1.6 變量 17
2.2 語句組成邏輯結構 18
2.2.1 運算符和表達式 19
2.2.2 語句 20
2.3 控製程序的執行 21
2.3.1 順序結構 21
2.3.2 分支結構 21
2.3.3 循環結構 22
2.4 有效存儲數據 24
2.4.1 列表 25
2.4.2 元組 27
2.4.3 字典 28
2.4.4 集合 29
2.4.5 特殊運算符 30
2.5 函數實現代碼復用 31
2.5.1 自定義函數 31
2.5.2 內置函數 32
2.5.3 字符串處理函數 33
2.5.4 函數式編程 33
2.6 存儲數據 35
2.6.1 文件操作 36
2.6.2 JSON和XML 36
2.7 案例:傳感器數據分析 40
2.8 習題 42
第3章 Python常用模塊 43
3.1 模塊的概念 44
3.2 自定義模塊 46
3.3 正則表達式模塊 46
3.4 NumPy和SciPy模塊 50
3.4.1 NumPy 51
3.4.2 SciPy 59
3.5 Pandas庫 61
3.6 習題 71
第4章 Python數據獲取 73
4.1 Web的客戶端/服務器工作模式 74
4.1.1 Web數據傳輸協議 75
4.1.2 Web頁面標記語言 78
4.1.3 Web樣式設計 81
4.2 Python設計爬蟲軟件 84
4.2.1 頁面請求庫URLLib 84
4.2.2 增強的網絡請求庫Requests 88
4.2.3 頁面內容解析庫BeautifulSoup 91
4.2.4 案例:在因特網上獲取電影評論數據 95
4.2.5 瀏覽器中模擬點擊的Selenium庫 97
4.3 多線程提升數據獲取的效率 103
4.3.1 多線程的使用方法 104
4.3.2 案例:多線程在頁面數據獲取中的應用 106
4.4 習題 109
第5章 Python數據挖掘基礎 111
5.1 數據挖掘的基本概念 112
5.1.1 數據挖掘中常用的術語 112
5.1.2 數據挖掘的流程 113
5.2 數據集是數據挖掘的基礎 115
5.2.1 各領域公開了大量的數據集 115
5.2.2 自定義數據 119
5.3 Python中常用的 數據挖掘庫 120
5.3.1 自然語言處理常用的NLTK庫 120
5.3.2 機器學習常用的Sklearn庫 125
5.4 習題 134
第6章 Python數據挖掘算法 135
6.1 數據挖掘中的分類 136
6.1.1 分類問題的基本思想 136
6.1.2 常見的分類算法 139
6.1.3 樸素貝葉斯分類算法的原理 145
6.1.4 案例:從頭實現樸素貝葉斯分類算法 146
6.2 數據挖掘中的聚類 148
6.2.1 聚類的基本思想 149
6.2.2 常見的聚類算法 152
6.2.3 K-means聚類算法的原理 168
6.2.4 案例:從頭實現K-means聚類算法 169
6.3 習題 171
第7章 Python大數據挖掘 173
7.1 深度學習是大數據處理的重要手段 174
7.1.1 深度學習來源於神經網絡 175
7.1.2 深度學習已有大量模型 187
7.1.3 深度學習框架提升使用效率 191
7.1.4 捲積神經網絡的工作原理 193
7.1.5 LSTM網絡的工作原理 196
7.1.6 案例:使用捲積神經網絡實現蔬菜識別系統 200
7.2 習題 204
第8章 Python數據可視化 207
8.1 可視化技術自然地展現數據規律 208
8.2 最為常用的Matplotlib庫 208
8.2.1 使用Matplotlib庫繪制各種圖形 211
8.2.2 Pandas庫中直接繪圖 216
8.3 Seaborn庫增強繪圖效果 219
8.4 Plotnine庫彌補可視化不足 225
8.5 案例:房價數據採集及可視化 228
8.6 習題 231
參考文獻 232


