Data Science Solutions with Python: Fast and Scalable Models Using Keras, PySpark MLlib, H2O, XGBoost, and Scikit-Learn
            
暫譯: 使用 Python 的數據科學解決方案:利用 Keras、PySpark MLlib、H2O、XGBoost 和 Scikit-Learn 快速且可擴展的模型
        
        Nokeri, Tshepo Chris
商品描述
Chapter 1: Understanding Machine Learning and Deep Learning.
Chapter goal: It carefully presents supervised and unsupervised ML and DL models and their application in the real world.
- Understanding Machine Learning. 
- Supervised Learning. 
- The Non-parametric method. 
- Ensemble Methods. 
- Unsupervised Learning.
- Cluster Analysis. 
- Dimension Reduction. 
- Exploring Deep Learning.
- Conclusion. 
The Parametric Method.
Chapter goal: It explains a big data framework recognized as PySpark, machine learning frameworks like SciKit-Learn, XGBoost, and H2O, and a deep learning framework called Keras.
- Big Data Frameworks and ML and DL Frameworks. 
- Characteristics of Big Data. 
- Impact of Big Data on Business and People. 
- Refined Product Development. 
- Improved Decision-Making. 
- Big Data Warehousing.
- Big Data ETL. 
- Big Data Frameworks. 
- Resilient Distributed Datasets. 
- Spark Configuration. 
- Spark Frameworks.
- ML Frameworks. 
- SciKit-Learn. 
- H2O.
- XGBoost. 
Big Data.
Better Customer Relationships.
Apache Spark.
DL Frameworks.
Keras.
Conclusion.
Chapter 3: The Parametric Method - Linear Regression.
Chapter goal: It considers the most popular parametric model - the Generalized Linear Model.
- Regression Analysis. 
- SciKit-Learn in action. 
- Spark MLlib in action. 
- H2O in action.
- Conclusion. 
Regression in practice.
Chapter goal: It covers two main survival regression analysis models, the Cox Proportional Hazards and Accelerated Failure Time model.
- Cox Proportional Hazards. 
- Lifeline in action. 
- Spark MLlib in Action. 
Conclusion.
Chapter 5: The Non-Parametric Method - Classification.
Chapter goal: It covers a binary classification model, recognized as Logistic Regression, using SciKit-Learn, Keras, PySpark MLlib, and H2O.
Logistic Regression.
- SciKit-Learn in action. 
- Spark MLlib in Action. 
- H2O in action.
Conclusion.
Chapter goal: It covers two main ensemble methods, the decision tree model and the gradient boost model.
Decision Tree.
SciKit-Learn in action.
Gradient Boosting.
- XGBoost in action. 
- H2O in action. 
Spark MLlib in Action.
Conclusion.
Chapter 7: Artificial Neural Networks.
Chapter goal: It covers deep learning and its application in the real world. It shows ways of designing, building, and testing an MLP classifier using the SciKit-Learn framework and an artificial neural network using the Keras framework.
Deep Learning.
Restricted Boltzmann Machine.
Multi-Layer Perception Neural Network.
- SciKit-Learn in action. 
- Keras in action. 
- H2O in action. 
Deep Belief Networks.
Chapter 8: Cluster Analysis using K-Means.
Chapter goal: It covers a technique of finding k, modelling and evaluating a cluster model known as K-Means using framework商品描述(中文翻譯)
第1章:理解機器學習與深度學習  
章節目標:仔細介紹監督式與非監督式的機器學習(ML)和深度學習(DL)模型及其在現實世界中的應用。  
- 理解機器學習。  
- 監督式學習。  
  - 參數方法。  
  - 非參數方法。  
  - 集成方法。  
- 非監督式學習。  
  - 聚類分析。  
  - 降維。  
- 探索深度學習。  
- 結論。  
第2章:大數據框架與機器學習及深度學習框架  
章節目標:解釋一個被認可的大數據框架PySpark,機器學習框架如SciKit-Learn、XGBoost和H2O,以及一個名為Keras的深度學習框架。  
- 大數據框架與機器學習及深度學習框架。  
- 大數據。  
  - 大數據的特徵。  
- 大數據對商業與人們的影響。  
  - 更好的客戶關係。  
  - 精細化的產品開發。  
  - 改善決策。  
- 大數據倉儲。  
  - 大數據ETL。  
- 大數據框架。  
  - Apache Spark。  
    - 韌性分散式資料集。  
    - Spark配置。  
    - Spark框架。  
- 機器學習框架。  
- SciKit-Learn。  
- H2O。  
- XGBoost。  
- 深度學習框架。  
  - Keras。  
- 結論。  
第3章:參數方法 - 線性回歸  
章節目標:考慮最受歡迎的參數模型 - 廣義線性模型。  
- 回歸分析。  
  - 實踐中的回歸。  
    - SciKit-Learn的應用。  
    - Spark MLlib的應用。  
    - H2O的應用。  
- 結論。  
第4章:生存回歸分析  
章節目標:涵蓋兩個主要的生存回歸分析模型,Cox比例風險模型和加速失敗時間模型。  
- Cox比例風險。  
- 生命線的應用。  
- 加速失敗時間(AFT)模型。  
  - Spark MLlib的應用。  
- 結論。  
第5章:非參數方法 - 分類  
章節目標:涵蓋一個二元分類模型,稱為邏輯回歸,使用SciKit-Learn、Keras、PySpark MLlib和H2O。  
- 邏輯回歸。  
- 實踐中的邏輯回歸。  
  - SciKit-Learn的應用。  
  - Spark MLlib的應用。  
  - H2O的應用。  
- 結論。  
第6章:基於樹的建模與梯度提升  
章節目標:涵蓋兩個主要的集成方法,決策樹模型和梯度提升模型。  
- 決策樹。  
  - SciKit-Learn的應用。  
- 梯度提升。  
  - XGBoost的應用。  
  - Spark MLlib的應用。  
  - H2O的應用。  
- 結論。  
第7章:人工神經網絡  
章節目標:涵蓋深度學習及其在現實世界中的應用。展示如何使用SciKit-Learn框架設計、構建和測試多層感知器(MLP)分類器,以及使用Keras框架的人工神經網絡。  
- 深度學習。  
  - 受限玻爾茲曼機。  
- 多層感知神經網絡。  
  - SciKit-Learn的應用。  
  - 深度信念網絡。  
  - Keras的應用。  
  - H2O的應用。  
- 結論。  
第8章:使用K-Means的聚類分析  
章節目標:涵蓋尋找k的技術,建模和評估一個稱為K-Means的聚類模型。
 
 
     
     
     
     
     
     
     
     
     
     
     
     
     
     
    