模态 | 参数 | 参数值 |
文本 | 文本最大长度 | 40 |
图像 | 图像块大小 | 32*32 |
多模态 | 学习率 | 2e−5 |
Dropout | 0.1 | |
批处理样本数 | 8 | |
α | 0.2 | |
β | 0.2 | |
Attention Heads | 12 |