参数名
设置值
迭代数Q和任务数K
4,10
学习率 α , β , γ
1e−3,1e−2,5e−3
训练集 D s u p 和 D q u e 样本量
1000,1000
适应集 D ad 和测试集 D te 样本量
500,20,000
内部更新步数 N i n
3