参数名称 | 参数值 |
词向量维度 | 300 |
Encoder | 3 |
注意力卷积头 | 15 |
epochs | 50 |
batch_size | 64 |
学习率 | 1e−3 |
dropout | 0.5 |
激活函数 | GelUs |
损失函数 | Cross-Entropy |
优化器 | Adam |