大數據分析與挖掘實驗教程
萬欣
- 出版商: 電子工業
 - 出版日期: 2023-06-01
 - 售價: $276
 - 語言: 簡體中文
 - 頁數: 160
 - ISBN: 7121456907
 - ISBN-13: 9787121456909
 - 
    相關分類:
    
      Data-mining
 
下單後立即進貨 (約4週~6週)
商品描述
本書是一本面向數據科學初學者的實驗教材。本書旨在通過實驗的方式,幫助學生掌握數據分析和挖掘的基本概念、方法和技術,並學會使用Python等工具進行實際操作。本書的實驗設計涵蓋了數據預處理、數據可視化、分類與預測、聚類與關聯規則挖掘、文本挖掘、網絡分析、時間序列分析、情感分析和主題模型等多個方面,旨在培養學生的數據思維和實際操作能力,為學生日後從事數據科學工作打下堅實的基礎。本書的實驗設計遵循理論與實踐相結合的原則,每個實驗都提供了詳細的理論知識和實驗步驟,以及實驗數據和代碼。通過實驗,學生可以熟悉數據分析與挖掘的實際操作流程,瞭解各種數據分析與挖掘方法的優缺點以及應用場景。同時,本書還鼓勵學生進行自主思考和創新,通過實驗提高學生解決問題的能力和創新能力。
目錄大綱
第一章  數據預處理	1
第一節  數據清洗	2
第二節  數據集成	3
第三節  數據變換	5
第四節  數據規約	7
第五節  Python中的數據預處理工具	8
小結	14
第二章  數據可視化	15
第一節  理解數據可視化的概念和重要性	16
第二節  使用Python的matplotlib和seaborn庫繪制基本圖形	17
第三節  繪制柱狀圖、折線圖、散點圖、箱線圖等常見圖形	21
第四節  利用圖形展示數據的關系和趨勢、數據的分析	24
第五節  利用交互式可視化工具進行高級數據可視化	29
小結	33
第三章  分類與預測	34
第一節  理解分類與預測的概念和應用場景	35
第二節  理解機器學習分類算法的基本原理	36
第三節  利用Python的scikit-learn庫進行分類算法的實現	43
第四節  利用交叉驗證、網格搜索等方法對分類算法進行優化	47
小結	51
第四章  聚類與關聯規則挖掘	52
第一節  理解聚類與關聯規則挖掘的概念和應用場景	53
第二節  理解聚類算法的基本原理	54
第三節  利用Python的scikit-learn庫進行聚類算法的實現	55
第四節  理解關聯規則挖掘的基本原理:Apriori算法	60
第五節  利用Python的mlxtend庫進行關聯規則挖掘的實現	64
小結	66
第五章  文本挖掘	67
第一節  理解文本挖掘的概念和應用場景	68
第二節  理解自然語言處理的基本概念及技術	69
第三節  利用Python的NLTK和jieba庫進行文本預處理	71
第四節  理解文本分類的基本原理和算法	79
第五節  利用Python的scikit-learn和keras庫進行文本分類的實現	83
小結	88
第六章  網絡分析	89
第一節  理解網絡分析的概念、應用場景和工具	90
第二節  理解網絡的基本概念	93
第三節  利用Python的NetworkX庫進行網絡構建和分析	95
第四節  理解社交網絡分析的基本原理和方法	98
第五節  利用Python的igraph庫進行社交網絡分析的實現	101
小結	104
第七章  時間序列分析	105
第一節  理解時間序列分析的概念和應用場景	106
第二節  理解時間序列的基本概念	106
第三節  利用Python的pandas庫進行時間序列數據的處理和分析	107
第四節  理解時間序列預測的基本原理和方法	109
第五節  利用Python的statsmodels庫進行時間序列預測的實現	111
小結	113
第八章  情感分析	115
第一節  理解情感分析的概念和應用場景	116
第二節  理解自然語言處理中的情感分析基本原理和方法	117
第三節  利用Python的NLTK和SnowNLP庫進行情感分析的實現	118
第四節  理解深度學習在情感分析中的應用	121
第五節  利用Python的keras和tensorflow庫進行深度學習情感分析
        的實現	124
小結	127
第九章  主題模型	129
第一節  理解主題模型的概念和應用場景	130
第二節  理解主題模型的基本原理和方法	131
第三節  利用Python的gensim和scikit-learn庫進行主題模型的實現	133
第四節  理解主題模型在文本分析、信息檢索和推薦系統中的應用	141
第五節  利用主題模型進行文本主題分析和推薦系統的 實現	142
小結	145
附錄A  實驗環境搭建	146
後記	148
