性能排行榜
KTransformers 官方及社区提交的性能测试数据
筛选:
| # | 精度 | GPU | CPU | 版本 | ||||
|---|---|---|---|---|---|---|---|---|
| 1 | DeepSeek-R1-0528 671B | FP8 | 8x L20 | 2x Intel Xeon 6454S | 227.85 | 87.58 | 0.4 | |
| 2 | MiniMax-M2.1 | FP8 | 2x RTX 5090 | 2x AMD EPYC 9355 | 4007.00 | 33.10 | 0.4 | |
| 3 | MiniMax-M2.1 | FP8 | 1x RTX 5090 | 2x AMD EPYC 9355 | 408.00 | 32.10 | 0.4 | |
| 4 | MiniMax-M2.1 | FP8 | 1x RTX 5090 | 2x AMD EPYC 9355 | 1196.00 | 31.40 | 0.4 | |
| 5 | MiniMax-M2.1 | FP8 | 1x RTX 5090 | 2x AMD EPYC 9355 | 2540.00 | 27.60 | 0.4 | |
| 6 | MiniMax-M2.1 | FP8 | 2x RTX 4090 | 2x Intel Xeon 8488C | 2269.00 | 21.60 | 0.4 | |
| 7 | MiniMax-M2.1 | FP8 | 1x RTX 4090 | 2x Intel Xeon 8488C | 1385.00 | 18.50 | 0.4 | |
| 8 | DeepSeek-R1/V3 671B | BF16 | 1x RTX 4090D | 2x Intel Xeon 6454S | 286.55 | 14.20 | 0.3 | |
| 9 | DeepSeek-R1/V3 671B | Q4_K_M | 1x RTX 4090D | 2x Intel Xeon 6454S | 97.32 | 13.69 | 0.2 | |
| 10 | DeepSeek-V3 671B | Q4_K_M | — | 2x Intel Xeon 6454S | 10.31 | 4.51 | — |
显示 10 / 10 条测试数据