指标
平均累积奖励
平均累积车辆延迟时间(s)
平均队列长度(辆)
算法收敛时间(s)
3DQN
−11057.10
20829.11
4
5653.62
3DQN-EN
−5399.41
13853.09
3
2623.50