智能風控:評分卡建模原理、方法與風控策略構建

張偉

買這商品的人也買了...

商品描述

這是一部系統講解評分卡建模的智能風控著作,從業務與技術、理論與實踐、
傳統風控與智能風控等角度透徹講解評分卡建模的原理、流程、方法及其風控策略構建。
作者在智能風控領域深耕十餘年,既熟悉商業銀行傳統風控體系思想、方法、技術、工具,
又熟悉人工智能背景下的創新智能風控相關解決方案、
風險策略和風險建模技術,本書是作者實踐經驗的系統性總結。
本書內容分為六部分。
第1部分(第1章)介紹評分卡建模基礎知識,
包括評分卡模型的概念和定義、評分卡建模全流程、評分卡模型的評價等。
第二部分(第2章)介紹銀行零售信貸領域產品特徵和業務流程,
以及信用風險和欺詐風險概念,介紹評分卡的應用場景和業務基礎知識。
第三部分(第3~11章)系統介紹評分建模的全流程,覆蓋需求理解、
數據理解、特徵工程、模型設計、模型開發、模型驗證、模型部署、
模型監控、模型優化等模型全生命週期各環節。
第四部分(第12~14章)總結了評分建模的關鍵問題及其解決方案,包括拒絕推斷、模型可解釋性等,
以及模型開發過程中諸如分佈不均衡、模型性能下降、模型迭代漂移等問題。
第五部分(第15章)介紹了當前業界除評分卡外使用頻率Z高的高維機器學習技術,
比較了傳統評分卡模型和高維機器學習模型,並重點介紹了XGBoost和LightGBM模型。
第六部分(第16章)以貸前自動化審批場景為例,介紹基於評分的自動化審批策略構建,
幫助讀者理解評分卡模型在風險策略設計中的應用。

作者簡介

張偉(筆名:上善若愚)
金融科技公司技術合夥人、高級風控總監及解決方案專家,
前FICO風險評分建模與風控業務策略專家。
在金融風險管理和智能風控領域有近15年工作經驗,擅長業務策略、量化建模、解決方案、風控體系建設,
專注於商業銀行、消費金融和金融科技行業,在智能風控策略模型數據決策體系建設、
風險業務架構和技術架構、信用風險業務策略與量化模型、信貸資產組合管理、
金融資產定價與風險管理、業務安全技術、巴塞爾新資本協議等方面積累了豐富的工作經驗。
曾作為技術專家或行業專家多次受邀出席上海市政府組織的行業產業聯盟研討調研座談,
多次受邀出席金融科技領域行業論壇並做主題演講或圓桌討論,多次接受主流金融科技媒體和財經媒體採訪,
並受聘為上海交通大學上海高金金融研究院研究員和華東理工大學商學院職業導師。

目錄大綱

讚譽
序1
序2
序3
前言
第1章 評分卡建模理論基礎 1
1.1 評分卡建模常見面試問題 1
1.2 關於模型的系統性理解 2
1.3 與建模密切相關的4個領域 3
1.3.1 機器學習 3
1.3.2 數據挖掘 4
1.3.3 數據分析 4
1.3.4 統計分析 5
1.3.5 四者之間的聯繫與區別 5
1.4 評分模型與評分卡模型 6
1.4.1 評分模型和評分卡模型的定義 6
1.4.2 評分卡模型的分類 6
1.4.3 評分卡模型的適用性 7
1.4.4 評分卡模型的價值 8
1.4.5 評分卡模型的應用 9
1.5 評分卡建模全流程 9
1.6 對評分卡模型的評價 10
1.7 本章小結 11
第2章 零售信貸業務基礎和風險管理 12
2.1 銀行零售信貸產品的產品特徵和業務流程 12
2.1.1 個人貸款 13
2.1.2 信用卡 17
2.2 信用與信用風險 21
2.2.1 信用風險識別 22
2.2.2 信用風險評估 23
2.2.3 信用風險監測 24
2.2.4 信用風險控制 24
2.2.5 徵信 25
2.3 欺詐與欺詐風險 26
2.3.1 欺詐風險的分類 27
2.3.2 欺詐風險的防範 27
2.3.3 欺詐風險與信用風險比較 27
2.4 本章小結 28
第3章 業務需求理解 29
3.1 業務需求理解概述 29
3.2 明確擬解決問題和分析目標 29
3.3 業務訪談的設計和實施 30
3.4 整體分析方案設計 31
3.5 本章小結 32
第4章 數據基礎決定模型效果上限 33
4.1 關於數據的系統性認識 33
4.1.1 數據基本特徵 33
4.1.2 常見數據問題 36
4.2 傳統信貸業務數據 37
4.2.1 貸款可用數據 38
4.2.2 信用卡可用數據 38
4.3 徵信數據 39
4.3.1 徵信數據概述 39
4.3.2 一代人行徵信 40
4.3.3 二代人行徵信 41
4.3.4 一、二代人行徵信的差異及映射轉換 42
4.3.5 人行徵信數據的使用 43
4.4 內外部大數據 44
4.4.1 大數據概述 44
4.4.2 銀行內部大數據 45
4.4.3 銀行外部大數據 45
4.5 數據質量診斷 46
4.5.1 數據質量診斷目的 46
4.5.2 數據質量診斷方法 47
4.6 業務數據分析 48
4.6.1 業務數據分析目的 48
4.6.2 業務數據分析方法 49
4.7 本章小結 49
第5章 利用特徵工程提取有效的風險特徵 50
5.1 特徵工程概述 50
5.1.1 特徵與特徵工程 50
5.1.2 數據處理與特徵工程流程 51
5.1.3 特徵工程的理論體系 51
5.1.4 特徵工程的抽象範式 52
5.2 特徵預處理與轉換 53
5.2.1 常見數據質量問題 53
5.2.2 特徵清洗與預處理 53
5.2.3 特徵編碼 54
5.2.4 特徵轉換 55
5.3 特徵提取與生成 56
5.3.1 業務專家經驗定義 56
5.3.2 工程化自動化衍生 56
5.3.3 表徵學習 58
5.4 特徵評價、選擇與降維 62
5.4.1 特徵評價 62
5.4.2 特徵選擇與降維 63
5.5 自動化特徵工程技術與工具 65
5.5.1 自動化特徵工程概述 65
5.5.2 自動化特徵工程工具 66
5.6 本章小結 74
第6章 評分卡模型設計 75
6.1 模型設計概述 75
6.1.1 模型設計的定義 75
6.1.2 模型設計的工作內容 76
6.2 排除規則與樣本範圍 76
6.2.1 排除規則和样本範圍的定義 76
6.2.2 申請評分卡模型排除規則 77
6.2.3 行為評分卡模型排除規則 77
6.2.4 催收評分卡模型排除規則 78
6.3 模型細分 79
6.4 表現期定義與Vintage分析 80
6.4.1 表現期定義 80
6.4.2 Vintage分析 80
6.5 滾動率 83
6.5.1 滾動率定義 83
6.5.2 滾動率分析 84
6.5.3 滾動率計算常見問題 84
6.6 觀察期的定義與選擇 85
6.6.1 觀察期的定義 85
6.6.2 觀察期的選擇 85
6.7 模型設計匯總計數 86
6.7.1 匯總計數定義 87
6.7.2 匯總計數的特別說明 87
6.8 建模方式和模型原型選擇 87
6.9 本章小結 88
第7章 評分卡模型開發 89
7.1 模型開發概述 89
7.2 樣本分區 90
7.3 樣本抽樣 91
7.4 變量預篩選 93
7.5 變量分箱 94
7.6 變量再篩選 96
7.7 變量轉換WOE 97
7.8 使用邏輯回歸進行模型擬合 97
7.8.1 多重共線性檢驗 97
7.8.2 邏輯回歸建模 98
7.8.3 模型訓練結果 100
7.9 模型驗證 101
7.9.1 排序性 101
7.9.2 區分能力 101
7.9.3 穩定性 103
7.9.4 分值集中度 103
7.9.5 分值分佈 104
7.9.6 離散度 104
7.10 評分標尺 105
7.11 模型導出PMML並測試 107
7.12 評分卡建模專用Python包 108
7.12.1 scorecardpy工具包 108
7.12.2 toad工具包 108
7.12.3 RiskModeler工具包 109
7.13 評分卡建模實例 109