| 模型 | 辅助处理 | 测试集标音准确率 |
| HMM-GMM | 字素切分并与音素对齐,数据平滑 | 81.24% |
| CRF | 字素切分并与音素对齐,特征模板 | 88.66% |
| RNN(tanh) | 字素切分并与音素对齐 | 87.54% |
| LSTM + CTC | 端到端 | 88.63% |
| GRU + CTC(ours) | 端到端 | 91.88% |