参数

取值

loss函数

交叉熵损失函数

优化器

SGD

batch size

128

epochs

50

learning rate

0.01

词向量维度

256

编码维度

2

隐层维度

256

r E A λ 1

0.25

r S C λ 2

0.30

r E I λ 3

0.45