基于强化学习的沥青路面长期性能养护决策方法

doi:10.3976/j.issn.1002-4026.2023.03.013

山东科学 ›› 2023, Vol. 36 ›› Issue (3): 108-114.doi: 10.3976/j.issn.1002-4026.2023.03.013

基于强化学习的沥青路面长期性能养护决策方法

侯明业(), 王晓阳^*(), 徐青杰, 杨博, 王笑风

河南省交通规划设计研究院股份有限公司,河南郑州 450000

收稿日期:2022-08-13 出版日期:2023-06-20 发布日期:2023-06-07
通信作者: * 王晓阳(1992—),男,硕士,工程师,研究方向为道路材料与信息化。E-mail: xywanghn@163.com
作者简介:侯明业(1990—),男,硕士,工程师,研究方向为道路材料与信息化。E-mail: lkwy1234@qq.com
基金资助:
河南省交通运输厅科技项目(2021T2);河南省交通运输厅科技项目(2021T8);河南省交通运输厅科技项目(2021G3)

Long-term performance maintenance decisions for asphalt pavements based on reinforcement learning

HOU Mingye(), WANG Xiaoyang^*(), XU Qingjie, YANG Bo, WANG Xiaofeng

Henan Communications Planning & Design Institute Co., Ltd., Zhengzhou 450000, China

Received:2022-08-13 Online:2023-06-20 Published:2023-06-07

摘要/Abstract

摘要：

针对道路长期性能养护决策中庞大的数据分析问题,将深度确定性策略梯度(deep deterministic policy gradient, DDPG)强化学习模型引入到了养护决策分析中,将道路性能的提升及养护资金的有效利用作为机器学习的奖励目标,建立了一套科学有效的沥青路面长期性能养护决策方法,经过与DQN(deep Q-learning network)算法和Q-Learning算法进行对比,DDPG算法所需要的采样数据更少、收敛速度更快,表现更为优异,可有效提升道路服役性能的评估效率,对沥青路面多目标长期养护决策方案的制定起着重要的推动作用。

关键词: 交通工程, 沥青路面, 养护决策, 强化学习, 深度确定性策略梯度模型

Abstract:

To address the huge data analysis problem in the decision-making for long-term road performance maintenance, this paper introduces the deep deterministic policy gradient (DDPG) reinforcement learning model in the maintenance decision analysis. A set of scientific and effective decision-making methods for long-term performance maintenance of asphalt pavements has been established through machine learning. These methods can improve road performance and make effective use of maintenance funds. Compared with the deep Q-learning network and Q-Learning algorithms, the DDPG algorithm requires less sampling data, converges faster, performs better, and can effectively improve the evaluation efficiency of the road service performance. Therefore, the proposed model plays an important role in the development of multi-objective maintenance decision-making for asphalt pavements.

Key words: traffic engineering, asphalt pavement, maintenance decision, reinforcement learning, deep deterministic policy gradient model

中图分类号:

U411

侯明业, 王晓阳, 徐青杰, 杨博, 王笑风. 基于强化学习的沥青路面长期性能养护决策方法[J]. 山东科学, 2023, 36(3): 108-114.

HOU Mingye, WANG Xiaoyang, XU Qingjie, YANG Bo, WANG Xiaofeng. Long-term performance maintenance decisions for asphalt pavements based on reinforcement learning[J]. Shandong Science, 2023, 36(3): 108-114.

图/表 6

表1

表2

图1

图2

表3

图3

参考文献 16

[1]	张春安, 田智鹏. 基于高等级公路沥青路面的预防性养护决策研究[J]. 公路工程, 2019, 44(6): 77-80. DOI:10.19782/j.cnki.1674-0610.2019.06.014. doi: 10.19782/j.cnki.1674-0610.2019.06.014
[2]	KODURU H K, XIAO F P, AMIRKHANIAN S N, et al. Using fuzzy logic and expert system approaches in evaluating flexible pavement distress: case study[J]. Journal of Transportation Engineering, 2010, 136(2): 149-157. DOI:10.1061/(asce)0733-947x(2010)136: 2(149). doi: 10.1061/(asce)0733-947x(2010)136: 2(149)
[3]	YANG C, REMENYTE-PRESCOTT R, ANDREWS J D. Pavement maintenance scheduling using genetic algorithms[J]. International Journal of Performability Engineering, 2015, 11(2):135-152.
[4]	施彦, 凌天清, 崔立龙, 等. 沥青路面预防性养护评价标准及决策优化研究[J]. 公路交通科技, 2020, 37(10): 25-34. doi: 10.3969/j.issn.1002-0268.2020.10.003
[5]	王向峰, 雍黎明. 公路沥青路面预防性养护路况标准与时机决策研究[J]. 公路工程, 2017, 42(6): 223-226.
[6]	王凯. 高速公路沥青路面养护管理决策优化研究[D]. 西安: 长安大学, 2014.
[7]	ZHOU G Q, WANG L B. Co-location decision tree for enhancing decision-making of pavement maintenance and rehabilitation[J]. Transportation Research Part C: Emerging Technologies, 2012, 21(1): 287-305. DOI:10.1016/j.trc.2011.10.007. doi: 10.1016/j.trc.2011.10.007
[8]	张春安, 田智鹏. 基于高等级公路沥青路面的预防性养护决策研究[J]. 公路工程, 2019, 44(6): 77-80. DOI:10.19782/j.cnki.1674-0610.2019.06.014. doi: 10.19782/j.cnki.1674-0610.2019.06.014
[9]	肖顺舟. 基于数据挖掘的路面预防性养护决策的研究与实现[D]. 武汉: 武汉理工大学, 2018.
[10]	HAFEZ M, KSAIBATI K, ATADERO R A. Optimizing expert-based decision-making of pavement maintenance using artificial neural networks with pattern-recognition algorithms[J]. Transportation Research Record: Journal of the Transportation Research Board, 2019, 2673(11): 90-100. DOI:10.1177/0361198119851085. doi: 10.1177/0361198119851085
[11]	郑炜, 杨威, 宋海静, 等. 一种基于规则提取的自动化测试用例生成方法[J]. 西北工业大学学报, 2012, 30(2): 296-300.
[12]	冯胜凯. 考虑不确定性因素的多目标路面养护决策优化研究[D]. 西安: 长安大学, 2020.
[13]	翟登攀, 张熙颖. 基于BP神经网络的道路预防性养护决策研究[J]. 交通科技与经济, 2020, 22(5): 63-66. DOI:10.19348/j.cnki.issn1008-5696.2020.05.013. doi: 10.19348/j.cnki.issn1008-5696.2020.05.013
[14]	赵鸿铎, 马鲁宽, 唐龙, 等. 基于数据挖掘的民用机场水泥道面维护辅助决策模型[J]. 同济大学学报(自然科学版), 2018, 46(12): 1676-1682.
[15]	曹巍, 陈长. 基于多属性分析理论的预防性养护决策方法[J]. 交通科学与工程, 2015, 31(4): 71-76. DOI:10.16544/j.cnki.cn43-1494/u.2015.04.013. doi: 10.16544/j.cnki.cn43-1494/u.2015.04.013
[16]	陈安琪. 国检体系下的沥青路面养护决策研究[D]. 南京: 东南大学, 2018.

类型	功能名称	类型	功能名称
路面结构与材料	面层结构厚度	路面状况	车辙深度
	面层材料类型		平整度
	基层结构厚度		路面破损率
	基层材料类型	温度	年平均最低气温
	底基层材料类型	温度	年平均最高气温
养护历史	养护类型	其他	道路服役年限
	养护材料		养护间隔
	病害处置		车道数量
交通轴载	轴载谱系数
	客货比
	日均交通量
	月当量轴载

编号	养护类型	养护材料	病害处置	编号	养护类型	养护材料	病害处置
1	上面层铣刨重铺	SMA-13	无	15	沥青面层铣刨重铺	SMA-13+AC-20+ AC-25	无
2		ECA-10	无	16		SMA-13+ Sup -20+ Sup -25	无
3		AC-13	无	17		AC-13+ AC-20+ AC-25	无
4		SMA-13	病害处置	18		AC -13+ Sup-20+ Sup-25	无
5		ECA-10	病害处置	19		SMA-13+AC-20+ AC-25	病害处置
6		AC-13	病害处置	20		SMA-13+ Sup -20+ Sup -25	病害处置
7	中、上面层铣刨重铺	AC-13+ AC-20	无	21		AC-13+ AC-20+ AC-25	病害处置
8		SMA-13+ AC-20	无	22		AC -13+ Sup-20+ Sup-25	病害处置
9		AC-13+ Sup-20	无	23	4 cm直接加铺	SMA-13	无
10		SMA-13+ Sup-20	无	24	就地热再生	-	无
11		AC-13+ AC-20	病害处置	25	2.5 cm薄层罩面	SMA-13	无
12		SMA-13+ AC-20	病害处置	26		ECA-10	无
13		AC-13+ Sup-20	病害处置	27		SMA-13	病害处置
14		SMA-13+Sup-20	病害处置	28		ECA-10	病害处置

年份	上面层铣刨重铺/km	中、上面层铣刨重铺/km	就地热再生/km	2.5 cm薄层罩面/km	养护总里程/km	路面技术状况
2022	7.218	0	0	8.756	15.974	95.87
2023	2.967	0	0	5.632	8.599	94.32
2024	2.889	0	0	5.101	7.990	94.31
2025	1.124	0	0	1.852	2.976	93.58
2026	5.338	0	0	0.500	5.838	93.52
2027	7.185	1.202	0	6.251	14.638	94.52
2028	4.305	0.752	0.5	0.638	6.195	94.11
2029	5.623	0.300	0	1.000	6.923	93.84
2030	13.523	0	0	5.785	19.308	95.27
2031	3.562	0	0	4.562	8.124	94.58

基于强化学习的沥青路面长期性能养护决策方法

Long-term performance maintenance decisions for asphalt pavements based on reinforcement learning

RichHTML

PDF (PC)

赞

可视化

摘要/Abstract

引用本文

使用本文

图/表 6

参考文献 16

相关文章 10

Metrics

本文评价

推荐阅读 0

[1]	姚红云, 曹志富, 凃强. 基于部分优势比的高速公路路产损失严重度分析[J]. 山东科学, 2022, 35(5): 80-88.
[2]	芮迎旭,唐铁桥. 同时考虑结伴行为和逆行行为的自行车流元胞自动机模型[J]. 山东科学, 2022, 35(2): 79-88.
[3]	王健, 徐志红, 童蔚苹, 宋雨嘉, 刘志远. 钩形弯交叉口信号协同控制优化方法研究[J]. 山东科学, 2020, 33(3): 109-118.
[4]	教欣萍, 王江锋, 陈磊, 高志军, 董佳宽, 黄海涛, 叶劲松. 基于HALRTC理论的短时交通流预测算法[J]. 山东科学, 2019, 32(6): 62-68.
[5]	王威, 吴中. 信号灯作用下的城市隧道路段交通流模型研究[J]. 山东科学, 2019, 32(3): 57-64.
[6]	李兴东, 袁振洲, 张羽, 郭宏伟. 基于元胞自动机的绿色驾驶行为特征仿真[J]. 山东科学, 2019, 32(2): 70-78.
[7]	兰慧慧，吴先宇，尹永昊. 基于路段流量平衡的转向交通量推算方法研究[J]. 山东科学, 2018, 31(3): 76-84.
[8]	陈伦，谷远利，陆文琦. 基于模糊综合评价的城市快速路交通状态判别研究[J]. 山东科学, 2017, 30(5): 62-69.
[9]	庄广新，谷远利，马韵楠，赵莹. 基于AHP灰色理论的道路交通流数据质量评价[J]. 山东科学, 2017, 30(1): 69-75.
[10]	夏萍萍，魏丽英，马壮林. 基于负二项回归模型的高速公路交通事故影响因素分析[J]. J4, 2013, 26(4): 79-84.