智能數據分析(基於R語言)

艾新波

  • 出版商: 人民郵電
  • 出版日期: 2025-09-01
  • 售價: $480
  • 語言: 簡體中文
  • 頁數: 315
  • ISBN: 711566935X
  • ISBN-13: 9787115669353
  • 相關分類: R 語言
  • 下單後立即進貨 (約4週~6週)

商品描述

本書分為問道、執具、博術三個篇章,分別介紹智能數據分析的方法論、編程工具及算法模型。問道篇介紹數據分析的核心理念、一般過程及思維方式,旨在闡揚數據分析的哲理;執具篇介紹R語言環境配置、基礎編程、數據對象,旨在闡述數據分析的先進工具;博術篇介紹數據可視化、關聯規則、分類、聚類等主流技術,旨在闡明數據分析的算法模型及其R語言實現。 本書可作為高等學校數據科學、數據計算及應用、智能科學與技術、人工智能等專業的教材,也可供數據分析領域的技術人員學習使用。

作者簡介

艾新波,北京郵電大學教授、博士生導師,國家級一流本科課程負責人,北京市安全生產領域學科帶頭人。長期致力於機器學習與數據挖掘的基礎理論及前沿應用研究,提出了比著名的Cauchy-Schwarz不等式更緊致的不等式系列、對Pearson相關系數進行了非線性推廣;在安全生產智能監測與大數據分析方面取得多項成果,獲省部級以上科技獎4項;獲北京高校第十二屆青年教師教學基本功比賽三等獎、北京郵電大學第十五屆教學觀摩評比一等獎;獲評北京郵電大學首屆優秀研究生育人導師;曾指導學生獲CCF大數據與智能計算大賽冠軍,獲CCF優秀指導教師獎。

目錄大綱

上篇·問道
第1章 緒論:氣象萬千,數以等觀
1.1 從等號說起
1.1.1 人類歷史上第一個被發現的定律
1.1.2 等號對比
1.1.3 神奇的等號
1.1.4 智能時代的等號
1.2 智能數據分析中的等號
1.2.1 智能數據分析
1.2.2 畫等號與構建模型
1.2.3 從等於到約等於
1.3 畫等號,觀世界
1.3.1 永葆好奇與熱情
1.3.2 機理模型與數據模型
1.4 等號之外,下文分解
1.4.1 等號之外
1.4.2 下文分解
1.5 本章小結
1.6 習題
第2章 方法論:所謂學習,歸類而已
2.1 從數據中學習知識
2.1.1 通用流程
2.1.2 任務分類
2.1.3 算法模型概覽
2.1.4 從結果到結論
2.2 學習的核心任務——歸類
2.2.1 類的發展史
2.2.2 歸類的一般含義
2.2.3 歸類與認知
2.2.4 學習的核心任務是歸類
2.3 學習的結果——關系結構
2.3.1 機器能學到什麼
2.3.2 幾種典型的關系結構
2.4 學習的方法——選擇而非構建
2.4.1 過程描述
2.4.2 基本要素
2.4.3 多視角解讀
2.4.4 與其他過程的對比
2.5 推理方式——歸納而非演繹
2.5.1 科學推理的兩種方法
2.5.2 學習的主要方法是歸納
2.5.3 學習是一種似真推理
中篇·執具
第3章 基礎編程:工欲善其事,必先利其器
3.1 R是什麼
3.1.1 R是智能時代最先進的工具之一
3.1.2 R是一種重要的學習和研究方式
3.1.3 R是一種語言
3.1.4 R是一種編程語言
3.2 R語言的設計理念
3.3 R代碼的運行機制
3.3.1 環境配置
3.3.2 運行機制
3.4 情境案例
3.4.1 問題情境
3.4.2 案例代碼
3.4.3 數據流轉過程
3.4.4 代碼組成
3.5 包和函數的查找
3.5.1 擴展包的查找
3.5.2 利用好幫助文檔
3.6 控制結構
3.6.1 順序結構
3.6.2 分支結構
3.6.3 循環結構
3.6.4 提升循環的執行效率
3.7 函數
3.7.1 什麼是函數
3.7.2 什麼時候需要函數
3.7.3 如何編寫函數
3.7.4 函數的參數
3.7.5 特殊的函數
3.8 異常處理
3.9 本章小結
3.10 習題
第4章 數據對象:萬法歸宗,數據為本
4.1 數據對象概覽
4.1.1 面向數據對象學習R語言
4.1.2 數據對象地圖
4.1.3 數據的材質——數據類型
4.1.4 數據對象的兩種視角
4.2 向量
4.2.1 創建向量
4.2.2 向量的四種下標
4.2.3 向量的常見操作
4.2.4 數學視角下的向量
4.3 因子
4.3.1 測量的尺度
4.3.2 因子的基本操作
4.3.3 有序因子
4.3.4 數據分箱操作
4.4 矩陣
4.4.1 矩陣的基本操作
4.4.2 矩陣的數學運算
4.5 數組
4.5.1 數組與圖像
4.5.2 圖像數組的基本操作
4.6 列表
4.6.1 列表的創建
4.6.2 訪問列表的子集
4.6.3 列表的基本操作
4.6.4 三種操作符[、[[和$的對比
4.7 數據框
4.7.1 數據框概述
4.7.2 數據框的基本操作
4.7.3 人人都愛tidyverse
4.7.4 最美不過數據框
4.8 本章小結
4.9 習題
下篇·博術
第5章 認識數據:觀數以形,辨形以識數
5.1 數與形
5.2 單變量描述
5.2.1 莖葉圖
5.2.2 直方圖
5.2.3 概率密度圖
5.2.4 小提琴圖
5.2.5 箱線圖
5.2.6 組合圖形
5.2.7 少量數字描述分布特征
5.3 變量之間的關系
5.3.1 矩形樹圖
5.3.2 散點圖
5.3.3 相關系數及其可視化
5.3.4 分組繪圖
5.4 高維數據空間的形態
5.4.1 三維散點圖
5.4.2 切爾諾夫臉譜圖
5.5 本章小結
5.6 習題
第6章 關聯:相隨相伴,謂之關聯
6.1 情境案例
6.1.1 啤酒與尿布的故事
6.1.2 打印機與A4紙
6.1.3 算法設計者面臨的問題
6.2 算法原理
6.2.1 基本概念
6.2.2 Apriori算法
6.2.3 模型評估
6.2.4 算法概要
6.3 R語言實現
6.3.1 業務理解
6.3.2 擴展包的選取
6.3.3 數據預處理
6.3.4 規則挖掘
6.3.5 規則評估
6.3.6 規則可視化
6.4 關聯關系再思考
6.4.1 一言以蔽之
6.4.2 新算法能否帶來更多有趣的規則
6.5 本章小結
6.6 習題
第7章 分類:既是世間法,自當有分別