| 参数名称 | 参数值 |
| 词向量维度 | 300 |
| Encoder | 3 |
| 注意力卷积头 | 15 |
| epochs | 50 |
| batch_size | 64 |
| 学习率 | 1e−3 |
| dropout | 0.5 |
| 激活函数 | GelUs |
| 损失函数 | Cross-Entropy |
| 优化器 | Adam |