输入模态
准确率
单触觉
94.7%
单视觉
95.3%
视觉 + 触觉
97.8%