指标

平均累积奖励

平均累积车辆延迟时间(s)

平均队列长度(辆)

算法收敛时间(s)

3DQN

−11057.10

20829.11

4

5653.62

3DQN-EN

−5399.41

13853.09

3

2623.50