| 加速方式 | OpenCL | 优化算法 | 加速比 |
| 图像读取 | 1.4 ms | 1.4 ms | 1.0 |
| 灰度图像转换 | 3.2 ms | 3.2 ms | 1.0 |
| X方向卷积 | 56.1 ms | 39.6 ms | 0.706 |
| Y方向卷积 | 56.0 ms | 39.6 ms | 0.707 |
| 梯度计算 | 18.9 ms | 14.1 ms | 0.746 |
| 总计 | 135.6 ms | 97.9 ms | 0.722 |