显卡FP32浮点性能TFLOPS排行

显卡FP32浮点性能介绍

FP32 浮点性能指的是显卡在进行 32位单精度浮点数计算 时的处理能力,常用于图形渲染、科学计算、AI 推理、物理模拟等需要高精度数学计算的场景。“FP”是 Floating Point(浮点数) 的缩写 ,“32”表示它是 32位的单精度浮点数(相对于 FP16 是半精度,FP64 是双精度),是显卡重要的性能指标之一。

显卡FP32浮点性能排名(持续更新中)

  1. NVIDIA GeForce RTX 5090 104.8 TFLOPS
  2. NVIDIA GeForce RTX 5090 D 104.8 TFLOPS
  3. NVIDIA GeForce RTX 4090 82.58 TFLOPS
  4. NVIDIA GeForce RTX 4090 D 73.54 TFLOPS
  5. NVIDIA GeForce RTX 5080 56.28 TFLOPS
  6. NVIDIA GeForce RTX 4080 SUPER 52.22 TFLOPS
  7. NVIDIA GeForce RTX 4080 48.74 TFLOPS
  8. AMD Radeon RX 9070 XT 48.66 TFLOPS
  9. NVIDIA GeForce RTX 4070 Ti SUPER 44.1 TFLOPS
  10. NVIDIA GeForce RTX 5070 Ti 43.94 TFLOPS
  11. NVIDIA GeForce RTX 4070 Ti 40.09 TFLOPS
  12. NVIDIA GeForce RTX 3090 Ti 40 TFLOPS
  13. NVIDIA GeForce RTX 3050 Mobile 40 TFLOPS
  14. AMD Radeon RX 9070 36.13 TFLOPS
  15. NVIDIA GeForce RTX 3090 35.58 TFLOPS
  16. NVIDIA GeForce RTX 4070 SUPER 35.48 TFLOPS
  17. AMD Radeon RX 9070 GRE 34.28 TFLOPS
  18. NVIDIA GeForce RTX 3080 Ti 34.1 TFLOPS
  19. NVIDIA GeForce RTX 4090 Mobile 32.98 TFLOPS
  20. NVIDIA GeForce RTX 5090 Mobile 31.80 TFLOPS
  21. NVIDIA GeForce RTX 5070 30.87 TFLOPS
  22. NVIDIA GeForce RTX 3080 29.77 TFLOPS
  23. NVIDIA GeForce RTX 4070 29.15 TFLOPS
  24. NVIDIA GeForce RTX 4080 Mobile 24.72 TFLOPS
  25. NVIDIA GeForce RTX 5060 Ti 23.7 TFLOPS
  26. NVIDIA GeForce RTX 5080 Mobile 23.04 TFLOPS
  27. NVIDIA GeForce RTX 4060 Ti 16GB 22.06 TFLOPS
  28. NVIDIA GeForce RTX 4060 Ti 22.06 TFLOPS
  29. NVIDIA GeForce RTX 3070 Ti 21.75 TFLOPS
  30. NVIDIA GeForce RTX 3070 20.31 TFLOPS
  31. NVIDIA GeForce RTX 5060 19.18 TFLOPS
  32. NVIDIA GeForce RTX 3080 Mobile 18.98 TFLOPS
  33. NVIDIA GeForce RTX 3060 Ti 16.2 TFLOPS
  34. NVIDIA GeForce RTX 3070 Mobile 15.97 TFLOPS
  35. NVIDIA GeForce RTX 3070 Ti Mobile 15.88 TFLOPS
  36. NVIDIA GeForce RTX 4070 Mobile 15.62 TFLOPS
  37. NVIDIA GeForce RTX 4060 15.11 TFLOPS
  38. NVIDIA GeForce RTX 4050 13.52 TFLOPS
  39. NVIDIA GeForce RTX 3060 8GB 12.74 TFLOPS
  40. NVIDIA GeForce RTX 3060 12.74 TFLOPS
  41. NVIDIA GeForce RTX 4060 Mobile 11.61 TFLOPS
  42. Intel Arc B570 11.52 TFLOPS
  43. NVIDIA GeForce RTX 3060 Mobile 10.94 TFLOPS
  44. NVIDIA GeForce RTX 3050 8GB 9.098 TFLOPS
  45. NVIDIA GeForce RTX 4050 Mobile 8.986 TFLOPS
  46. NVIDIA GeForce RTX 3050 OEM 8.986 TFLOPS
  47. NVIDIA GeForce RTX 3050 6GB Mobile 7.639 TFLOPS
  48. NVIDIA GeForce RTX 3050 6GB 6.774 TFLOPS
  49. NVIDIA GeForce RTX 3050 4GB Mobile 6.18 TFLOPS
  50. NVIDIA GeForce RTX 3050 Ti Mobile 5.299 TFLOPS
  51. NVIDIA GeForce RTX 3050 A Mobile 4.813 TFLOPS
  52. AMD Radeon 740M 2.56 TFLOPS
  53. Intel UHD Graphics 730 N/A

显卡FP32浮点性能计算方法

显卡的 FP32 浮点性能(单位是 TFLOPS)可以大致通过以下公式估算:

FP32 性能(TFLOPS) = CUDA核心数 × 主频 × 每个时钟的操作数 × 2(如果是 FMA 指令) ÷ 1,000,000

以 NVIDIA RTX 3080 为例,它的 CUDA核心数:8704,主频:1.71 GHz,根据公式计算:8704 × 1.71 × 2 ≈ 29.77 TFLOPS,这就意味着 RTX 3080 每秒大约能进行 29.77 万亿次 FP32 运算。

显卡FP32浮点性能的意义

游戏更依赖的是 图形渲染能力(光栅/着色器等),FP32 性能虽然相关,但不是决定性因素,但它确实影响一些高负载的图形计算,比如光线追踪、物理模拟等。

AI/深度学习方面,FP32 性能直接影响神经网络的前向推理和训练速度,但现在更高效的是 FP16 或更低精度的混合精度计算(Tensor Core 支持)。

科学计算 / 工业仿真的高精度需求场景下,FP32 是基本门槛,有些任务还要求 FP64,更适合专业卡如 NVIDIA A100、Quadro 系列。