参数名

设置值

迭代数Q和任务数K

4,10

学习率 α , β , γ

1e−3,1e−2,5e−3

训练集 D s u p D q u e 样本量

1000,1000

适应集 D ad 和测试集 D te 样本量

500,20,000

内部更新步数 N i n

3