金融商業數據分析 : 基於 Python 和 SAS

張秋劍,張浩,周大川,常國珍 著

  • 出版商: 機械工業
  • 出版日期: 2021-12-01
  • 定價: $594
  • 售價: 8.5$505
  • 語言: 簡體中文
  • 頁數: 356
  • 裝訂: 平裝
  • ISBN: 7111695836
  • ISBN-13: 9787111695837
  • 相關分類: Data Science
  • 立即出貨

買這商品的人也買了...

商品描述

這是一本金融商業數據分析的實戰工具書。
作者都是在金融行業有10~20年數據分析經驗的資深專家,
他們將多年來的項目經驗、培訓和諮詢經驗融合成了這本書。
它將指導讀者零基礎掌握金融數據分析的工具、思路、方法和技巧,
快速實現從入門到進階的突破。
本書強調實戰,方法論與實踐相結合,
所有案例均來自實際的金融業務,涵蓋工具使用、數據處理、
統計分析等數據分析的全流程。
本書內容共14章,可分為3篇。
分析工具篇(第1~4章):
首先介紹了數據科學和數理統計的基本常識,
然後講解了數據分析工具SAS EG和Python的基礎知識。
數據處理篇(第5~9章):
首先通過描述性統計分析進行數據探索,繼而講到基本的報表和統計製圖,
還包括使用SAS EG進行數據處理,用Python進行數據整合、數據清洗,構建出滿足分析需求的數據集。
統計分析篇(第10~14章):
從統計學的基本概念引出假設檢驗與樣本t檢驗,三大統計檢驗、
構造預測模型,並分享基於時間序列算法的建模方法。

作者簡介

張秋劍
就職於騰訊雲金融拓展中心,從事微信財富營銷管理、數據中台、
AI應用等解決方案拓展工作,研究方向包括數字化轉型、創新實踐等。

張浩
曾任騰訊雲金融首席架構師和星環科技金融行業技術總監,
主要從事大數據、人工智能、雲計算、區塊鏈、聯邦學習等相關技術研發與產品設計,
具有豐富的企業架構設計、企業數字化戰略轉型運營與業務諮詢經驗。

周大川
就職於某中央金融企業金融科技研發中心,主要從事企業級數據平台開發、核心業務平台建設、
AI賦能金融科技創新等工作,具有豐富的新一代金融業務系統建設經驗。

常國珍
曾任畢馬威諮詢大數據總監,具有近20年數據挖掘、精益數據治理、
數字化運營諮詢經驗,是金融信用風險、反欺詐和反洗錢算法領域的專家。

目錄大綱

前言
分析工具篇
第1章 數據科學與數理統計2
1.1 數據科學的基本概念2
1.2 數理統計技術5
1.2.1 描述性統計分析5
1.2.2 統計推斷與統計建模6

第2章 SAS EG數據操作基礎8
2.1 SAS EG入門8
2.1.1 SAS EG簡介8
2.1.2 SAS EG的窗口及菜單9
2.2 訪問數據10
2.2.1 SAS EG實現方式11
2.2.2 SAS程序實現方式13
2.3 定義SAS數據集13
2.3.1 SAS數據的相關概念13
2.3.2 SAS EG實現方式16
2.3.3 SAS程序實現方式18
2.4 導入其他格式的數據文件19
2.4.1 SAS EG實現方式19
2.4.2 SAS程序實現方式21

第3章 Python編程基礎22
3.1 Python概述22
3.2 Anaconda的安裝及使用方法23
3.2.1 下載與安裝23
3.2.2 使用Jupyter Notebook24
3.2.3 使用Spyder25
3.2.4 使用Conda管理第三方庫27
3.3 Python的基本數據類型29
3.3.1 字符串29
3.3.2 浮點型和整型29
3.3.3 布爾類型30
3.3.4 其他數據類型31
3.4 Python的基本數據結構31
3.4.1 列表32
3.4.2 元組33
3.4.3 集合33
3.4.4 字典34
3.5 Python的編程結構35
3.5.1 三種基本的編程結構簡介35
3.5.2 順序結構35
3.5.3 分支結構36
3.5.4 循環結構37
3.6 Python的函數與模塊40
3.6.1 Python的函數40
3.6.2 Python的模塊42
3.7 使用Pandas讀寫結構化數據43
3.7.1 讀數據43
3.7.2 寫數據46

第4章 在SAS EG中使用程序47
4.1 如何在SAS EG中使用程序47
4.2 SAS程序49
4.2.1 SAS程序分析簡介49
4.2.2 DATA步50
4.2.3 PROC步51
數據處理篇

第5章 描述性統計分析與製圖54
5.1 描述性統計分析54
5.1.1 變量度量類型與分佈類型54
5.1.2 變量的統計量56
5.1.3 連續變量的分佈與集中趨勢56
5.1.4 連續變量的離散程度58
5.1.5 數據分佈的對稱與高矮59
5.2 製作報表與統計圖60
5.3 製圖步驟及統計圖適用場景64
5.4 利用SAS EG進行統計分析67
5.4.1 連續變量描述性統計分析67
5.4.2 單因子頻數統計分析69
5.4.3 匯總統計分析72
5.4.4 繪製條形圖進行統計分析76
5.4.5 繪製地圖進行統計分析79

第6章 表數據的行處理82
6.1 數據篩選82
6.1.1 SAS EG實現方式82
6.1.2 SAS程序實現方式84
6.2 排序與求秩87
6.2.1 SAS EG實現方式87
6.2.2 SAS程序實現方式94
6.3 抽樣95
6.3.1 抽樣理論介紹95
6.3.2 SAS EG實現方式97
6.3.3 SAS程序實現方式99
6.4 數據分組和匯總100
6.4.1 SAS EG實現方式100
6.4.2 SAS程序實現方式102

第7章 表數據的列處理103
7.1 構造列變量103
7.2 拆分列105
7.3 堆疊列107
7.4 轉置列110
7.4.1 SAS EG實現方式111
7.4.2 SAS 程序實現方式113
7.5 對列重編碼114
7.5.1 SAS EG實現方式114
7.5.2 SAS程序實現方式119
7.6 變量標準化119
7.6.1 SAS EG實現方式120
7.6.2 SAS程序實現方式122

第8章 數據集的操作124
8.1 縱向連接124
8.1.1 SAS EG實現方式125
8.1.2 SAS程序實現方式127
8.2 橫向連接131
8.2.1 SAS EG實現方式131
8.2.2 SAS程序實現方式135
8.3 數據集的比較138
8.3.1 SAS EG實現方式138
8.3.2 SAS程序實現方式141
8.4 創建格式142
8.4.1 相關理論介紹142
8.4.2 SAS EG實現方式143
8.4.3 SAS程序實現方式146
8.5 刪除數據集、格式和視圖147
8.5.1 SAS EG實現方式147
8.5.2 SAS程序實現方式148

第9章 利用Python處理數據149
9.1 數據整合150
9.1.1 行操作和列操作150
9.1.2 條件查詢152
9.1.3 橫向連接155
9.1.4 縱向合併157
9.1.5 排序159
9.1.6 分組匯總160
9.1.7 拆分與堆疊列163
9.1.8 賦值與條件賦值165
9.2 數據清洗167
9.2.1 重複值處理167
9.2.2 缺失值處理168
9.2.3 噪聲值處理170
9.3 實戰175
9.3.1 提取行為特徵的RFM方法175
9.3.2 使用RFM方法計算變量176
9.3.3 數據整理與匯報177
統計分析篇

第10章 數據科學的統計推斷180
10.1 基本的統計學概念180
10.1.1 總體、樣本和統計量180
10.1.2 點估計、區間估計和中心極限定理181
10.2 假設檢驗186
10.2.1 理論介紹186
10.2.2 利用Python實現單樣本t檢驗189
10.2.3 利用SAS EG實現單樣本t檢驗189
10.2.4 利用SAS EG實現雙樣本t檢驗189
10.2.5 利用Python實現雙樣本t檢驗191
10.3 方差分析193
10.3.1 利用Python實現單因素方差分析193
10.3.2 利用SAS EG實現單因素方差分析198
10.3.3 利用Python實現多因素方差分析202
10.3.4 利用SAS EG實現多因素方差分析204
10.4 相關分析207
10.4.1 相關分析理論207
10.4.2 Python實現方式210
10.4.3 SAS EG實現方式210
10.5 列聯表分析與卡方檢驗211
10.5.1 利用Python實現列聯表分析212
10.5.2 利用SAS EG實現列聯表分析213
10.5.3 利用Python實現卡方檢驗215
10.5.4 利用SAS EG實現卡方檢驗216

第11章 構造連續變量的預測模型219
11.1 線性回歸模型介紹219
11.1.1 簡單線性回歸220
11.1.2 多元線性回歸224
11.2 模型的構建226
11.2.1 多元線性回歸模型的構建226
11.2.2 將連續變量和分類變量同時作為解釋變量來構建模型228
11.3 線性回歸模型的診斷230
11.3.1 殘差230
11.3.2 強影響點234
11.3.3 共線性236
11.4 建模流程238
11.5 利用SAS EG實現客戶價值預測239
11.5.1 單連續變量下建模239
11.5.2 多連續變量下建模242
11.5.3 加入分類解釋變量建模243

第12章 構造二分類變量的預測模型245
12.1 邏輯回歸入門245
12.2 模型表現優劣的評估251
12.3 多水平值分類變量的邏輯回歸253
12.4 關於構造因果關係模型的討論255
12.5 利用SAS EG實現貸款違約可能性預測257

第13章 描述性數據分析方法266
13.1 客戶細分266
13.1.1 客戶細分的意義266
13.1.2 根據客戶利潤貢獻細分268
13.1.3 根據個人或公司的生命歷程細分269
13.1.4 根據客戶的產品偏好細分269
13.1.5 根據客戶的多維行為屬性細分270
13.1.6 根據客戶結構細分271
13.1.7 綜合應用272
13.2 連續變量間關係探索與變量壓縮273
13.2.1 多元變量間關係統計基礎273
13.2.2 多元變量壓縮的思路276
13.2.3 主成分分析278
13.2.4 因子分析288
13.3 聚類分析293
13.3.1 基本邏輯293
13.3.2 層次聚類294
13.3.3 快速聚類301
13.3.4 兩步法聚類308

第14章 時間序列分析314
14.1 時間序列及其分析方法簡介314
14.2 利用效應分解法分析時間序列316
14.2.1 時間序列的效應分解316
14.2.2 SAS EG實現方式316
14.2.3 Python實現方式318
14.3 平穩時間序列分析322
14.3.1 平穩時間序列簡介322
14.3.2 AR模型、MA模型、ARMA模型簡介323
14.3.3 Python實現方式324
14.4 非平穩時間序列分析328
14.4.1 差分與ARIMA模型328
14.4.2 SAS EG實現方式330
14.4.3 Python實現方式336