即時配送智能優化決策

王淩、陳靖方、鄭潔、王興

  • 出版商: 清華大學
  • 出版日期: 2025-08-01
  • 售價: $348
  • 語言: 簡體中文
  • ISBN: 7302697442
  • ISBN-13: 9787302697442
  • 相關分類: Reinforcement
  • 下單後立即進貨 (約4週~6週)

  • 即時配送智能優化決策-preview-1
  • 即時配送智能優化決策-preview-2
  • 即時配送智能優化決策-preview-3
即時配送智能優化決策-preview-1

相關主題

商品描述

本書主要介紹即時配送問題的建模,以及路徑規劃、訂單指派和訂單推薦等核心優化決策問題的高效求解方法。本書共10章,具體內容如下:第 1章為緒論,主要介紹即時配送問題的研究進展、數學建模及計算建模;第2章為基於啟發式規則與監督學習的路徑規劃;第 3章為基於貪婪疊代與端到端學習的隨機路徑規劃,主要介紹確定和不確定場景下的路徑規劃方法;第4章為基於圖神經網絡與後悔值的訂單指派;第 5章為基於多調度規則與監督學習的訂單指派;第6章為基於多鄰域搜索與模仿學習的訂單指派,主要介紹多騎手、小單量和大單量場景下的訂單指派方法;第7章為基於貪婪疊代與快速評價的隨機訂單指派;第 8章為基於弱監督學習與自適應平衡策略的不確定訂單指派,主要介紹出餐時間和供需關系不確定場景下的訂單指派方法;第9章為基於意願預估與召回排序的訂單推薦;第10章為基於深度強化學習與反饋信息辨識的訂單推薦,主要介紹單輪決策和序貫決策場景下的訂單推薦方法。

作者簡介

王淩,清華大學自動化系長聘教授,獲國家傑出青年科學基金,中國高被引作者,擔任SEC、IJAAC主編、CSMS執行主編、ESWA高級編輯、IEEE TEVC、MC等期刊副主編、控制理論與應用、控制與決策、計算機集成制造系統、系統工程與電子技術等期刊編委。主要從事人工智能及智能控制與調度優化研究,已出版專著5部、在IEEE Trans等期刊上發表SCI論文350余篇、WOS引用2萬余次、Google Scholar引用3萬余次。曾獲國家自然科學二等獎、教育部自然科學一等獎、中國仿真學會自然科學一等獎和創新技術一等獎、北京市科技新星、中國自動化學會青年科學家獎、清華大學學術新人獎、IEEE TEVC傑出AE、INFORMS Franz Edelman Finalist Award等。

目錄大綱

目錄 

第1章緒論1

1.1配送問題代表性研究進展2

1.1.1動態車輛路徑問題2

1.1.2取送問題4

1.1.3即時配送問題7

1.2即時配送問題數學建模8

1.2.1數學模型8

1.2.2模型特點12

1.3即時配送問題計算建模12

1.3.1即時配送問題分解12

1.3.2路徑規劃模型14

1.3.3訂單指派模型17

1.3.4訂單推薦模型21

參考文獻23

第2章基於啟發式規則與監督學習的路徑規劃31

2.1引言31

2.2啟發式路徑規劃算法32

2.2.1訂單排序規則32

2.2.2插入式路徑構造算法33

2.2.3基於地理信息的加速策略34

2.2.4路徑構造過程分析35

2.3基於XGBoost的排序規則自適應選擇37

2.3.1XGBoost算法37

2.3.2特征設計40

2.3.3XGBoost增強的路徑構造算法42

2.4離線數值實驗43

2.4.1實驗設置43

2.4.2模型預測效果評估46

2.4.3算法優化效果評估47

2.4.4不同正負樣本比例下算法表現及分析49

2.4.5特征有效性分析50

參考文獻51

第3章基於貪婪疊代與端到端學習的隨機路徑規劃55

3.1引言55

3.2問題建模55

3.3算法設計58

3.3.1貪婪疊代算法58

3.3.2端到端深度學習60

3.4離線數值實驗65

3.4.1實驗設置65

3.4.2自環節有效性驗證67

3.4.3算法優化效果及效率評估69

參考文獻72

第4章基於圖神經網絡與後悔值的訂單指派73

4.1引言73

4.2基於圖神經網絡的兩階段優化方法73

4.2.1問題特征的嵌入表示73

4.2.2註意力機制75

4.2.3基於圖神經網絡的高效篩選77

4.2.4基於後悔值的貪婪指派79

4.3離線數值實驗80

4.3.1實驗設置81

4.3.2模型預測效果評估84

4.3.3算法優化效果及效率評估85

4.4在線A/B測試89

4.4.1實驗設置89

4.4.2應用效果90

參考文獻94

第5章基於多調度規則與監督學習的訂單指派95

5.1引言95

5.2帶自適應策略的指派框架95

5.2.1算法框架95

5.2.2疊代匹配算法96

5.2.3基於機器學習模型的自適應策略98

5.3離線數值實驗103

5.3.1實驗設置103

5.3.2模型預測效果評估105

5.3.3特征有效性分析106

5.3.4算法優化效果評估106

5.4在線A/B測試111

5.4.1實驗設置111

5.4.2應用效果111

參考文獻112

第6章基於多鄰域搜索與模仿學習的訂單指派113

6.1引言113

6.2算法設計113

6.2.1算法框架113

6.2.2啟發式指派算法114

6.2.3專家算法118

6.2.4機器學習模型123

6.3離線數值實驗126

6.3.1實驗設置126

6.3.2算法優化效果及效率評估128

6.4在線A/B測試135

6.4.1實驗設置135

6.4.2應用效果135

參考文獻136

第7章基於貪婪疊代與快速評價的隨機訂單指派137

7.1引言137

7.2問題建模137

7.2.1符號定義137

7.2.2目標函數建模138

7.3算法設計140

7.3.1帶過濾的貪婪疊代算法141

7.3.2混合路徑規劃算法143

7.4離線數值實驗152

7.4.1實驗設置152

7.4.2自環節有效性驗證155

7.4.3算法優化效果評估157

參考文獻158

第8章基於弱監督學習與自適應平衡策略的不確定訂單指派160

8.1引言160

8.2問題描述161

8.2.1符號定義161

8.2.2模糊邏輯系統163

8.2.3問題建模164

8.3辨識+平衡框架167

8.3.1算法框架167

8.3.2實時供需辨識模塊167

8.3.3多目標平衡模塊173

8.4離線數值實驗175

8.4.1實驗設置175

8.4.2算法優化效果評估176

8.5在線A/B測試178

8.5.1實驗設置178

8.5.2應用效果178

參考文獻181

第9章基於意願預估與召回排序的訂單推薦183

9.1引言183

9.2快送場景調度系統運行流程184

9.3“預測+優化”分層求解框架186

9.3.1預測層——騎手意願預估186

9.3.2優化層——推薦列表生成189

9.4離線數值實驗192

9.4.1實驗設置192

9.4.2模型預測效果評估194

9.4.3算法優化效果評估194

參考文獻199

第10章基於深度強化學習與反饋信息辨識的訂單推薦201

10.1引言201

10.2問題描述和MDP建模202

10.3基於深度強化學習和反饋信息辨識的訂單推薦框架205

10.3.1演員評論家網絡結構205

10.3.2騎手行為預測網絡結構207

10.3.3反饋信息辨識網絡結構208

10.3.4訓練方法211

10.3.5測試方法212

10.4離線數值實驗214

10.4.1實驗設置214

10.4.2模型預測效果評估214

10.4.3訂單推薦算法對比216

10.5在線A/B測試219

10.5.1實驗設置219

10.5.2應用效果220

參考文獻220