数据集

模型

训练时间

康奈尔电影对话数据集

Without RL

18 h

Srinivasan’s (RL)

46 h

Ours (RL)

26 h