模态
参数
参数值
文本
文本最大长度
40
图像
图像块大小
32*32
多模态
学习率
2e−5
Dropout
0.1
批处理样本数
8
α
0.2
β
0.2
Attention Heads
12