山东科学 ›› 2023, Vol. 36 ›› Issue (3): 108-114.doi: 10.3976/j.issn.1002-4026.2023.03.013
HOU Mingye(), WANG Xiaoyang*(), XU Qingjie, YANG Bo, WANG Xiaofeng
摘要:
针对道路长期性能养护决策中庞大的数据分析问题,将深度确定性策略梯度(deep deterministic policy gradient, DDPG)强化学习模型引入到了养护决策分析中,将道路性能的提升及养护资金的有效利用作为机器学习的奖励目标,建立了一套科学有效的沥青路面长期性能养护决策方法,经过与DQN(deep Q-learning network)算法和Q-Learning算法进行对比,DDPG算法所需要的采样数据更少、收敛速度更快,表现更为优异,可有效提升道路服役性能的评估效率,对沥青路面多目标长期养护决策方案的制定起着重要的推动作用。
中图分类号: