R & Python 數據科學與機器學習實踐

(日)有賀友紀//(日)大橋俊介 譯 朱迎慶

  • 出版商: 中國水利水電
  • 出版日期: 2022-08-01
  • 定價: $539
  • 售價: 8.5$458
  • 語言: 簡體中文
  • 頁數: 384
  • 裝訂: 平裝
  • ISBN: 7522604478
  • ISBN-13: 9787522604473
  • 相關分類: Machine LearningData Science
  • 立即出貨

買這商品的人也買了...

商品描述

《R&Python數據科學與機器學習實踐》以動手實踐的形式分紹了數據分析、統計分析和機器學習的相關內容,
可以讓讀者在短時間內掌握使用R語言和Python從數據創建模型並獲取結果的基本步驟,
並用R&Python體驗學習各種分析的“理論”和“實際思維方式”。
全書共5章,
其中第1章介紹了數據科學入門的基礎知識,讓讀者對數據科學領域有一個整體認識;
第2章介紹了R&Python的語法基礎和編程入門相關知識,為編程基礎薄弱的讀者順利學習本書打好堅實的編程基礎;
第3~4章介紹了非常重要的數據處理、數據分析和用R語言實現的統計建模方法;
第5章介紹了用Python實現的以預測為目的的機器學習方法。
對實踐中經常遇到的數據質量問題和處理要點、回歸模型、決策樹、聚類、降推,
以及常用的監督學習方法和深度學習等內容均進行了講解。
《R&Python數據科學與機器學習實踐》不是一本入門書,它是一本盡可能不使用數學公式面專注於利用的書,
致力於讓讀者掌握使用R/Python實踐數據科學與機器學習的基本技能並獲得自身持續發展和深入學習所需的素養,
特別適合有一定統計學和機器學習基礎,想快速提陞技能的程序員學習,
也適合作為高校統計學、數據科學和人工智能相關專業的參考書。

作者簡介

有賀友紀,人類科學碩士。
在野村綜合研究所從事與企業IT應用趨勢相關的調查和研究工作。
根據從大學專業(心理學)中掌握的定量分析的經驗出發,重點關注如何合理地利用數據和解決問題。
另外,他還負責公司內部有關數據科學的培訓計劃制定、內容製作和教學工作。

目錄大綱

第1章數據科學入門
1.1數據科學的基礎
1.1.1數據科學的重要性
1.1.2數據科學的定義及歷史
1.1.3數據科學中的建模
1.1.4數據科學及其相關領域
1.2數據科學的實施
1.2.1數據科學的流程及任務
1.2.2數據科學實施所需的工具
1.2.3數據科學實施所需的技能
1.2.4數據科學的局限性及挑戰
第2章R語言與Python語言
2.1R語言與Python語言的比較
2.2R語言入門
2.2.1R語言的概述
2.2.2R語言的語法
2.2.3數據結構與控制結構
2.3Python語言入門
2.3.1Python語言概述
2.3.2Python語言的語法
2.3.3Python語言的程序設計
2.3.4NumPy與Pandas
2.4比較R語言與Python語言的運行實例
第3章數據分析與典型的模型
3.1捕捉數據特徵
3.1.1捕捉分佈的形態——視覺上的確認
3.1.2計算描述性統計量——代表值與離散程度
3.1.3把握關聯性——相關係數的使用方法和含義
3.1.4使用R語言的相關分析——利用日本地方政府調查數據的案例
3.1.5各種統計分析——理論與實際思考方式
3.2根據數據建立模型
3.2.1目標變量和解釋變量——解釋和預測的“方向”
3.2.2簡單線性回歸模型——R語言程序的運行與結果
3.2.3使用虛擬變量建模——分析組間差異
3.2.4複雜線性回歸模型——交互作用及模型之間的比較
3.2.5線性回歸的原理與最小二乘法
3.3評估模型
3.3.1用於評估模型的觀點
3.3.2這個結果難道不是偶然的嗎?——假設概率和顯著性差異檢驗
3.3.3模型是否與數據擬合——擬合係數與決定係數
3.3.4模型是否過於復雜——過擬合和預測精度
3.3.5殘差分佈——線性回歸模型和診斷圖
3.3.6解釋變量之間的相關性——多重共線性
3.3.7標準偏回歸係數
第4章實踐性的模型
4.1建模的準備
4.1.1數據的準備與處理加工
4.1.2分析和建模的方法
4.2數據的加工處理
4.2.1數據的清洗
4.2.2分類變量的加工
4.2.3數值變量的處理加工與數據縮放
4.2.4改變分佈形態—-對數變換與Logit變換
4.2.5缺失值的處理
4.2.6離群值的處理
4.3建模的方法
4.3.1分組——聚類
4.3.2指標聚合——因子分析和主成分分析
4.3.3廣義線性模型與逐步回歸方法
4.3.4以二值數據為目標變量的分析——邏輯回歸方法
4.3.5分段抽樣及其特徵的分析——決策樹
4.4因果推論
4.4.1由數據明確因果關係——統計性因果推論
4.4.2基於因果關係的變量選擇
第5章機器學習與深度學習
5.1機器學習的目的與步驟
5.1.1機器學習的基礎
5.1.2機器學習的步驟
5.1.3關於數據準備的問題
5.1.4抽出特徵與特徵向量
5.2機器學習的運行
5.2.1機器學習程序庫的應用——scikit-learn
5.2.2機器學習算法的示例——隨機森林
5.2.3機器學習算法的示例——支持向量機
……