模型

辅助处理

测试集标音准确率

HMM-GMM

字素切分并与音素对齐,数据平滑

81.24%

CRF

字素切分并与音素对齐,特征模板

88.66%

RNN(tanh)

字素切分并与音素对齐

87.54%

LSTM + CTC

端到端

88.63%

GRU + CTC(ours)

端到端

91.88%