数据集
模型
训练时间
康奈尔电影对话数据集
Without RL
18 h
Srinivasan’s (RL)
46 h
Ours (RL)
26 h