指标

平均累积奖励

平均累积车辆延迟时间(s)

平均队列长度(辆)

算法收敛时间(s)

Fixed-time

−19288.20

38030.69

7

/

DQN_AM

−28733.50

42652.57

8

/

DQN

−13128.20

23616.87

4

5339.84

Double DQN

−11227.60

21144.17

4

6810.92

Dueling DQN

−11097.50

20971.76

4

4670.25

3DQN-EN

−5399.41

13853.09

3

2623.50