参数

设置

会话数据包数量

16

数据包有效载荷字节

1600

数据包图像尺寸

(40, 40)

会话图像尺寸

(160, 160)

初始嵌入维度

256

上下文嵌入维度

256

注意力机制层数(通道数)

8

卷积核大小

3

卷积核个数

512

激活函数

ReLU

密集层神经元数量

1024

损失函数

交叉熵

优化器

Adam

学习率

0.0005

预热学习率

0.1

批次大小

16

训练轮次

30

训练集、验证集、测试集数量之比

7:1:2