模型 | 辅助处理 | 测试集标音准确率 |
HMM-GMM | 字素切分并与音素对齐,数据平滑 | 81.24% |
CRF | 字素切分并与音素对齐,特征模板 | 88.66% |
RNN(tanh) | 字素切分并与音素对齐 | 87.54% |
LSTM + CTC | 端到端 | 88.63% |
GRU + CTC(ours) | 端到端 | 91.88% |