智能風控:原理算法與工程實踐

梅子行

  • 出版商: 機械工業
  • 出版日期: 2020-01-01
  • 定價: $534
  • 售價: 8.5$454
  • 語言: 簡體中文
  • ISBN: 7111643534
  • ISBN-13: 9787111643531
  • 相關分類: 人工智慧
  • 立即出貨 (庫存 < 3)

買這商品的人也買了...

商品描述

本書基於Python全面介紹了機器學習在信貸風控領域的應用與實踐,
從原理、算法與工程實踐3個維度全面展開,包21種實用算法和26個解決方案。

作者是智能風控、人工智能和算法領域的專家,曾
在多加知名金融科技企業從事風控算法方面的研究與實踐,
經驗豐富,本書得到了風控領域9位專家的高度評價。

全書一共8章,每個章節都由問題、算法、案例三部分組成,具有系統性和實戰性。
-2章講解了信貸業務的基礎知識以及常用的規則引擎、信用評估引擎的建模方法。
3章以項目冷啟動為背景,講解了風控領域應用廣泛的遷移學習方法。
4-5章介紹了倖存者偏差與不均衡學習中所使用的無監督學習與半監督學習方法。
6章闡述了無監督的異常識別算法,該算法常用於數據清洗與冷啟動項目,
是反欺引擎中常用的個體欺檢測方法。
7章分享了一些經作者實踐證明效果較好的模型優化方法,
並對模型融合的思路進行了較為詳細的介紹。
8章重點講解了知識圖譜相關的複雜網絡基礎知識及網絡表示學習方法,
其中的社區發現算法常用於團伙欺檢測。
此外,本章中的部分方法對信用評估模型的優化也有很大幫助。

作者簡介

梅子行

風控技*專家、AI技*專家和算法專家,現就職於滿幫科技,負責機器學習在風控領域的算法優化。

歷任多家知名金融科技公司的風控算法研究員、數據挖掘工程師。

師承Experian、Discover等企業的風控專家,擅長深度學習、複雜網絡、
遷移學習、異常檢測等非傳統機器學習方法,
熱衷於數據挖掘以及算法的跨領域優化實踐。

公眾號與知乎專欄:“大數據風控與機器學習”。

目錄大綱

推薦序
前言
章 風控建模與規則挖掘 / 1
1.1 信貸與風險 / 1
1.1.1 信貸業務與互聯網金融風控體系 / 1
1.1.2 信貸風險與控制 / 4
1.2 工業建模流程 / 5
1.2.1 抽象業務 / 6
1.2.2 定義標籤 / 6
1.2.3 樣本選取 / 7
1.2.4 特徵工程與模型調優 / 9
1.2.5 上線監控與評估報表 / 10
1.3 規則挖掘方案 / 13
1.4 本章小結 / 20

2章 集成模型評分卡 / 21
2.1 特徵工程解析 / 21
2.1.1 特徵與模型 / 22
2.1.2 信用模型的特徵 / 22
2.2 特徵衍生方案 / 24
2.3 離散處理 / 27
2.3.1 one-hot編碼 / 27
2.3.2 WOE編碼 / 28
2.4 迭代特徵篩選方案 / 33
2.5 自動化調參 / 38
2.5.1 自動化調參策略 / 38
2.5.2 參數搜索方案 / 39
2.5.3 調參框架搭建 / 40
2.6 遞歸特徵刪除方案 / 43
2.7 評分卡製作 / 44
2.7.1 邏輯回歸評分卡 / 45
2.7.2 集成模型的評分映* / 55
2.7.3 針對業務改寫評價函數 / 59
2.8 本章小結 / 60

3章 遷移學習與冷啟動 / 61
3.1 遷移學習基礎 / 61
3.1.1 應用場景 / 62
3.1.2 概念介紹 / 62
3.2 遷移學習方 / 63
3.2.1 三類常見算法 / 63
3.2.2 遷移的實現方法 / 64
3.3 少量有標籤樣本的遷移方案 / 65
3.3.1 TrAdaBoost模型 / 65
3.3.2 跨場景遷移模型 / 67
3.4 無標籤樣本遷移之A / 76
3.4.1 A模型 / 76
3.4.2 模型應用 / 79
3.5 無標籤樣本遷移之DTELM / 80
3.5.1 ELM模型 / 81
3.5.2 DTELM模型 / 82
3.5.3 模型應用 / 84
3.6 遷移樣本篩選方案 / 88
3.6.1 背景介紹 / 88
3.6.2 算法框架概覽 / 88
3.6.3 搭建融合框架 / 89
3.7 本章小結 / 93

4章 倖存者偏差 / 95
4.1 倖存者偏差的義 / 95
4.2 增量學習 / 96
4.3 生成對抗網絡 / 97
4.3.1 GAN模型介紹 / 98
4.3.2 GAN與倖存者偏差 / 99
4.4 高斯混合模型 / 100
4.4.1 GMM算法原理 / 101
4.4.2 GMM簡單應用 / 103
4.4.3 GMM中的概率模型 / 104
4.4.4 GMM樣本生成 / 107
4.5 信息準則 / 110
4.5.1 赤池信息準則 / 110
4.5.2 貝葉斯信息準則 / 111
4.5.3 AIC與BIC比較 / 111
4.6 本章小結 / 112

5章 不均衡學習 / 113
5.1 樣本不均衡 / 113
5.2 代價敏感加權方案 / 114
5.3 *值過採樣方案 / 115
5.3.1 SMOTE算法 / 115
5.3.2 過採樣算法實踐 / 116
5.4 半監督學習方案 / 121
5.4.1 前提假設 / 122
5.4.2 S3VM / 122
5.4.3 LP / 127
5.5 本章小結 / 130
6章 異常檢測 / 132
6.1 離*點與欺檢測 / 133
6.2 z-score檢驗 / 134
6.3 LOF異常檢測法 / 134
6.3.1 原理與算法流程 / 135
6.3.2 LOF樣本清洗方案 / 137
6.4 IF異常檢測法 / 139
6.4.1 原理與算法流程 / 139
6.4.2 PreA模型與冷啟動 / 141
6.5 本章小結 / 144

7章 模型優化 / 145
7.1 多損失函數分段預測 / 145
7.1.1 兩種損失函數 / 146
7.1.2 融合流程 / 146
7.2 樹模型特徵衍生 / 149
7.2.1 GBDT離散化 / 149
7.2.2 融合方案詳解 / 150
7.2.3 特徵衍生細節 / 151
7.2.4 案例 / 151
7.3 時間序列建模 / 160
7.3.1 RNN / 160
7.3.2 LSTM / 163
7.3.3 門控結構 / 164
7.3.4 LSTM行為評分卡案例 / 166
7.4 高維稀疏數據建模 / 170
7.4.1 算法原理 / 171
7.4.2 算法應用 / 172
7.5 模型融合 / 173
7.5.1 模型融合基礎 / 173
7.5.2 模型篩選 / 174
7.5.3 業務應用方案 / 181
7.6 本章小結 / 183

8章 知識圖譜 / 184
8.1 複雜網絡基礎 / 184
8.2 中心度與相似性 / 187
8.3 節點分類 / 193
8.3.1 樸素節點分類 / 193
8.3.2 鄰節點加權投票 / 195
8.3.3 一致性標籤傳播 / 197
8.4 社區發現算法 / 200
8.4.1 基礎概念 / 200
8.4.2 Girvan-New*n算法 / 201
8.4.3 Louvain算法 / 202
8.4.4 社區評估 / 204
8.5 網絡表示學習 / 206
8.5.1 矩陣分解 / 207
8.5.2 節點嵌入 / 210
8.6 圖卷積神經網絡 / 215
8.6.1 卷積神經網絡 / 215
8.6.2 傅里葉變換 / 217
8.6.3 拉普拉斯算子 / 219
8.6.4 G中的圖卷積 / 221
8.7 本章小結 / 225
參考文獻 / 226