模态

参数

参数值

文本

文本最大长度

40

图像

图像块大小

32*32

多模态

学习率

2e−5

Dropout

0.1

批处理样本数

8

α

0.2

β

0.2

Attention Heads

12