参数名称

参数值

词向量维度

300

Encoder

3

注意力卷积头

15

epochs

50

batch_size

64

学习率

1e−3

dropout

0.5

激活函数

GelUs

损失函数

Cross-Entropy

优化器

Adam