即時配送智能優化決策
王淩、陳靖方、鄭潔、王興
- 出版商: 清華大學
- 出版日期: 2025-08-01
- 售價: $348
- 語言: 簡體中文
- ISBN: 7302697442
- ISBN-13: 9787302697442
-
相關分類:
Reinforcement
下單後立即進貨 (約4週~6週)
相關主題
商品描述
作者簡介
目錄大綱
目錄
第1章緒論1
1.1配送問題代表性研究進展2
1.1.1動態車輛路徑問題2
1.1.2取送問題4
1.1.3即時配送問題7
1.2即時配送問題數學建模8
1.2.1數學模型8
1.2.2模型特點12
1.3即時配送問題計算建模12
1.3.1即時配送問題分解12
1.3.2路徑規劃模型14
1.3.3訂單指派模型17
1.3.4訂單推薦模型21
參考文獻23
第2章基於啟發式規則與監督學習的路徑規劃31
2.1引言31
2.2啟發式路徑規劃算法32
2.2.1訂單排序規則32
2.2.2插入式路徑構造算法33
2.2.3基於地理信息的加速策略34
2.2.4路徑構造過程分析35
2.3基於XGBoost的排序規則自適應選擇37
2.3.1XGBoost算法37
2.3.2特征設計40
2.3.3XGBoost增強的路徑構造算法42
2.4離線數值實驗43
2.4.1實驗設置43
2.4.2模型預測效果評估46
2.4.3算法優化效果評估47
2.4.4不同正負樣本比例下算法表現及分析49
2.4.5特征有效性分析50
參考文獻51
第3章基於貪婪疊代與端到端學習的隨機路徑規劃55
3.1引言55
3.2問題建模55
3.3算法設計58
3.3.1貪婪疊代算法58
3.3.2端到端深度學習60
3.4離線數值實驗65
3.4.1實驗設置65
3.4.2自環節有效性驗證67
3.4.3算法優化效果及效率評估69
參考文獻72
第4章基於圖神經網絡與後悔值的訂單指派73
4.1引言73
4.2基於圖神經網絡的兩階段優化方法73
4.2.1問題特征的嵌入表示73
4.2.2註意力機制75
4.2.3基於圖神經網絡的高效篩選77
4.2.4基於後悔值的貪婪指派79
4.3離線數值實驗80
4.3.1實驗設置81
4.3.2模型預測效果評估84
4.3.3算法優化效果及效率評估85
4.4在線A/B測試89
4.4.1實驗設置89
4.4.2應用效果90
參考文獻94
第5章基於多調度規則與監督學習的訂單指派95
5.1引言95
5.2帶自適應策略的指派框架95
5.2.1算法框架95
5.2.2疊代匹配算法96
5.2.3基於機器學習模型的自適應策略98
5.3離線數值實驗103
5.3.1實驗設置103
5.3.2模型預測效果評估105
5.3.3特征有效性分析106
5.3.4算法優化效果評估106
5.4在線A/B測試111
5.4.1實驗設置111
5.4.2應用效果111
參考文獻112
第6章基於多鄰域搜索與模仿學習的訂單指派113
6.1引言113
6.2算法設計113
6.2.1算法框架113
6.2.2啟發式指派算法114
6.2.3專家算法118
6.2.4機器學習模型123
6.3離線數值實驗126
6.3.1實驗設置126
6.3.2算法優化效果及效率評估128
6.4在線A/B測試135
6.4.1實驗設置135
6.4.2應用效果135
參考文獻136
第7章基於貪婪疊代與快速評價的隨機訂單指派137
7.1引言137
7.2問題建模137
7.2.1符號定義137
7.2.2目標函數建模138
7.3算法設計140
7.3.1帶過濾的貪婪疊代算法141
7.3.2混合路徑規劃算法143
7.4離線數值實驗152
7.4.1實驗設置152
7.4.2自環節有效性驗證155
7.4.3算法優化效果評估157
參考文獻158
第8章基於弱監督學習與自適應平衡策略的不確定訂單指派160
8.1引言160
8.2問題描述161
8.2.1符號定義161
8.2.2模糊邏輯系統163
8.2.3問題建模164
8.3辨識+平衡框架167
8.3.1算法框架167
8.3.2實時供需辨識模塊167
8.3.3多目標平衡模塊173
8.4離線數值實驗175
8.4.1實驗設置175
8.4.2算法優化效果評估176
8.5在線A/B測試178
8.5.1實驗設置178
8.5.2應用效果178
參考文獻181
第9章基於意願預估與召回排序的訂單推薦183
9.1引言183
9.2快送場景調度系統運行流程184
9.3“預測+優化”分層求解框架186
9.3.1預測層——騎手意願預估186
9.3.2優化層——推薦列表生成189
9.4離線數值實驗192
9.4.1實驗設置192
9.4.2模型預測效果評估194
9.4.3算法優化效果評估194
參考文獻199
第10章基於深度強化學習與反饋信息辨識的訂單推薦201
10.1引言201
10.2問題描述和MDP建模202
10.3基於深度強化學習和反饋信息辨識的訂單推薦框架205
10.3.1演員評論家網絡結構205
10.3.2騎手行為預測網絡結構207
10.3.3反饋信息辨識網絡結構208
10.3.4訓練方法211
10.3.5測試方法212
10.4離線數值實驗214
10.4.1實驗設置214
10.4.2模型預測效果評估214
10.4.3訂單推薦算法對比216
10.5在線A/B測試219
10.5.1實驗設置219
10.5.2應用效果220
參考文獻220



