| 线程网格大小(块) | 线程块中线程数(个) | 输入矩阵 | 内核类型 | 描述 |
| 4 × 4 | 32 × 32 | 120 × 120 | S | 小型计算密集型 |
| 8 × 8 | 32 × 32 | 240 × 240 | M | 中等计算密集型 |
| 12 × 12 | 32 × 32 | 360 × 360 | L | 大型计算密集型 |
| 16 × 16 | 32 × 32 | 480 × 480 | XL | 超大计算密集型 |