Python 3 數據分析與機器學習實戰 Python 3 数据分析与机器学习实战

龍馬高新教育

  • 出版商: 北京大學出版社
  • 出版日期: 2018-07-30
  • 定價: $414
  • 售價: 7.5$311
  • 語言: 簡體中文
  • 頁數: 316
  • 裝訂: 平裝
  • ISBN: 7301295669
  • ISBN-13: 9787301295663
  • 相關分類: Python程式語言Data ScienceMachine Learning
  • 立即出貨 (庫存 < 3)

買這商品的人也買了...

商品描述

機器之所以能學習,來源於大量的數據分析。《Python 3數據分析與機器學習實戰》首先講述數據分析的過程,然後詳細介紹常用的機器學習理論、算法與案例(大型案例29個),最終以解決實際問題驅動成書。
  
本書主要介紹的機器學習算法及數據分析方法,包括數據預處理、分類問題、預測問題、網絡爬蟲、數據降維、數據壓縮、關聯分析、集成學習和深度學習等。全書分三大部分共17章:第0~3章介紹Python的基礎知識、安裝和基本語法;第4~7章介紹Python的基本編程、機器學習基礎及Python中常用的第三方庫函數,並介紹數據預處理的基本方法;第8~16章分別介紹常用的機器學習分析算法及深度學習等。每章都採用多個經典案例圖文並茂地介紹機器學習的原理和實現方法。

本書通熟易懂,並免費贈送全程同步教學錄像和Python 3編程基礎雙錄像,非常適合作為Python及機器學習和數據分析的入門與提高課程;對於不太熟悉Python、又想學習機器相關算法的初學者非常適合。

作者簡介

龍馬高新教育成立於1998年,專注於計算機類圖書的策劃與編寫,其圖書曾多次獲得全國優秀熱銷書獎。
龍馬高新教育有著非常深厚的資源積累,與龍馬簽約的協作機構包括39所高校、8家協會、5家知名網站及近百名撰稿人。

目錄大綱

第0章本書的技術體系
0.1 Python的發展趨勢
0.2人工智能時代學習Python的重要性
0.3本書的技術體系
0.4學習本書需要注意的事項

第1章Python基礎知識
1.1 Python簡介
1.1.1了解Python的起源與發展歷史
1.1.2 Python的特色
1.1.3學習Python的原因
1.2 Python的當前版本
1.3 Python的優缺點
1.4 Python與其他語言的區別
1.5 Python的應用領域

第2章Python的安裝、配置與卸載
2.1 Python的安裝
2.1.1 Python的下載
2.1.2 Python的安裝
2.2 Python的配置
2.2.1 Python環境變量的設置
2.2.2 Python的啟動
2.3 Python的卸載

第3章Python 3基礎語法
3.1第一個Python程序
3.2 Python的輸入和輸出
3.2.1 Python的輸出語句
3.2.2 Python的輸入語句
3.3 Python的基本數據類型
3.3.1數字
3.3.2字符串
3.3.3列表
3.3.4元組
3.3.5集合
3.3.6字典
3.4 Python庫的導入
3.5 Python的集成開發環境
3.6自測練習

第4章Python 3的編程
4.1條件語句
4.2循環語句
4.2.1 while循環
4.2.2 for循環
4.3函數
4.4模塊
4.5自測練習

第5章機器學習基礎
5.1機器學習概述
5.2監督學習簡介
5.3非監督學習簡介
5.4增強學習簡介
5.5深度學習簡介
5.6機器學習常用術語

第6章Python機器學習及分析工具
6.1矩陣操作函數庫(NumPy)
6.1.1 NumPy的安裝
6.1.2 NumPy的基本使用
6.2科學計算的核心包(SciPy)
6.2.1科學計算的核心包的安裝
6.2 .2科學計算的核心包的基本使用
6.3 Python的繪圖庫(Matplotlib)
6.3.1 Matplotlib簡介及安裝
6.3.2 Matplotlib的基本使用
6.4數據分析包(Pandas)
6.4.1 Pandas簡介和安裝
6.4.2 Pandas的基本使用方法
6.5機器學習函數庫(Scikit-learn)
6.6統計建模工具包(StatsModels)
6.7深度學習框架(TensorFlow)

第7章數據預處理
7.1數據預處理概述
7.2數據清理
7.2.1異常數據處理
7.2.2缺失值處理
7.2.3噪聲數據處理
7.3數據集成
7.4數據變換
7.5數據歸約
7.6 Python的主要數據預處理函數
7.6. 1 Python的數據結構
7.6.2數據缺失處理函數

第8章分類問題
8.1分類概述
8.2常用方法
8.2.1 k-近鄰算法
8.2.2樸素貝葉斯
8.2.3支持向量機
8.2.4 AdaBoost算法
8.2. 5決策樹
8.2.6 Multi-layer Perceptron多層感知機
8.3項目實戰
8.3.1實例1:使用k-近鄰算法實現約會網站的配對效果
8.3.2實例2:使用樸素貝葉斯過濾垃圾郵件
8.3.3實例3:SVM實現手寫識別系統
8.3.4實例4:基於單層決策樹構建分類算法
8.3.5實例5:使用決策樹對iris數據集分類
8.3.6實例6:使用決策樹對身高體重數據進行分類
8.3.7實例7:使用k-近鄰算法對鳶尾花數據進行交叉驗證
8.3.8使用多層感知器分析,根據葡萄酒的各項化學特徵來
判斷葡萄酒的優劣
8.4自測練習

第9章預測分析
9.1預測概述
9.2常用方法
9.2.1時間序列分析預測法
9.2.2 BP神經網絡模型
9.3項目實戰
9.3.1實例1:根據一年的歷史數據預測後十年的數據趨勢
9.3.2實例2:使用神經網絡預測公路運量
9.4自測練習

第10章關聯分析
10.1關聯分析概述
10.2基本方法
10.2.1 Apriori算法
10.2.2 FP-Growth算法
10.3項目實戰(解決目前流行的實際問題)
10.3 .1用Apriori進行關聯分析的實例
10.3.2使用FP-Growth算法提取頻繁項集
10.4自測練習

第11章網絡爬蟲
11.1網絡爬蟲概述
11.1.1網絡爬蟲 理
11.1.2爬蟲分類
11.2網頁抓取策略和方法
11.2.1網頁抓取策略
11.2.2網頁抓取的方法
11.3項目實戰
11.3.1用Python抓取指定的網頁
11.3.2用Python抓取包含關鍵詞的網頁
11.3.3下載貼吧中的圖片
11.3.4股票數據抓取
11.4自測練習

第12章集成學習
12.1集成學習概述
12.2常用方法
12.2.1 Bagging和隨機森林
12.2.2 Boosting和AdaBoost 
12.3項目實戰
12.3 .1使用隨機森林方法預測乘員的存活概率
12.3.2使用AdaBoost方法進行二元分類
12.4自測練習

第13章深度學習
13.1深度學習概述
13.2常用方法
13.2.1監督學習的深度學習網絡結構
13.2.2非監督學習的深度學習網絡結構
13.3項目實戰
13.3.1使用TensorFlow框架進行MNIST數據集生成
13.3.2使用Theano框架進行MNIST數字識別
13.4自測練習

第14章數據降維及壓縮
14.1數據降維及壓縮概述
14.1.1數據降維
14.1.2圖像壓縮
14.2基本方法
14.2.1主成分分析
14.2.2奇異值分解
14.3項目實戰
14.3.1主成分分析PCA實例
14.3.2使用奇異值分解進行圖像壓縮
14.4自測練習

第15章聚類分析
15.1聚類分析概述
15.2 K-means算法
15.2.1 K-means算法與步驟
15.2.2 K-means算法涉及的問題
15.2.3實際聚類問題的處理流程
15.3項目實戰
15.3 .1 K-means算法實現二維數據聚類
15.3.2使用Scikit-learn中的方法進行聚類分析
15.4自測練習

第16章回歸分析問題
16.1回歸分析概述
16.2基本方法
16.2.1一元回歸分析
16.2 .2多元線性回歸
16.2.3回歸的計算方法
16.2.4邏輯回歸分析
16.3項目實戰
16.3.1身高與體重的回歸分析
16.3.2房價預測
16.3.3產品銷量與廣告的多元回歸分析
16.3.4鳶尾花數據的邏輯回歸分析
16.4 自測練習