显卡FP32浮点性能TFLOPS排行 | CPU Rank List对比工具

显卡FP32浮点性能介绍

FP32 浮点性能指的是显卡在进行 32位单精度浮点数计算时的处理能力，常用于图形渲染、科学计算、AI 推理、物理模拟等需要高精度数学计算的场景。“FP”是 Floating Point（浮点数）的缩写，“32”表示它是 32位的单精度浮点数（相对于 FP16 是半精度，FP64 是双精度），是显卡重要的性能指标之一。

显卡FP32浮点性能排名（持续更新中）

NVIDIA GeForce RTX 5090 104.8 TFLOPS
NVIDIA GeForce RTX 5090 D 104.8 TFLOPS
NVIDIA GeForce RTX 4090 82.58 TFLOPS
NVIDIA GeForce RTX 4090 D 73.54 TFLOPS
NVIDIA GeForce RTX 5080 56.28 TFLOPS
NVIDIA GeForce RTX 4080 SUPER 52.22 TFLOPS
NVIDIA GeForce RTX 4080 48.74 TFLOPS
AMD Radeon RX 9070 XT 48.66 TFLOPS
NVIDIA GeForce RTX 4070 Ti SUPER 44.1 TFLOPS
NVIDIA GeForce RTX 5070 Ti 43.94 TFLOPS
NVIDIA GeForce RTX 4070 Ti 40.09 TFLOPS
NVIDIA GeForce RTX 3090 Ti 40 TFLOPS
NVIDIA GeForce RTX 3050 Mobile 40 TFLOPS
AMD Radeon RX 9070 36.13 TFLOPS
NVIDIA GeForce RTX 3090 35.58 TFLOPS
NVIDIA GeForce RTX 4070 SUPER 35.48 TFLOPS
AMD Radeon RX 9070 GRE 34.28 TFLOPS
NVIDIA GeForce RTX 3080 Ti 34.1 TFLOPS
NVIDIA GeForce RTX 4090 Mobile 32.98 TFLOPS
NVIDIA GeForce RTX 5090 Mobile 31.80 TFLOPS
NVIDIA GeForce RTX 5070 30.87 TFLOPS
NVIDIA GeForce RTX 3080 29.77 TFLOPS
NVIDIA GeForce RTX 4070 29.15 TFLOPS
NVIDIA GeForce RTX 4080 Mobile 24.72 TFLOPS
NVIDIA GeForce RTX 5060 Ti 23.7 TFLOPS
NVIDIA GeForce RTX 5080 Mobile 23.04 TFLOPS
NVIDIA GeForce RTX 4060 Ti 16GB 22.06 TFLOPS
NVIDIA GeForce RTX 4060 Ti 22.06 TFLOPS
NVIDIA GeForce RTX 3070 Ti 21.75 TFLOPS
NVIDIA GeForce RTX 3070 20.31 TFLOPS
NVIDIA GeForce RTX 5060 19.18 TFLOPS
NVIDIA GeForce RTX 3080 Mobile 18.98 TFLOPS
NVIDIA GeForce RTX 3060 Ti 16.2 TFLOPS
NVIDIA GeForce RTX 3070 Mobile 15.97 TFLOPS
NVIDIA GeForce RTX 3070 Ti Mobile 15.88 TFLOPS
NVIDIA GeForce RTX 4070 Mobile 15.62 TFLOPS
NVIDIA GeForce RTX 4060 15.11 TFLOPS
NVIDIA GeForce RTX 4050 13.52 TFLOPS
NVIDIA GeForce RTX 3060 8GB 12.74 TFLOPS
NVIDIA GeForce RTX 3060 12.74 TFLOPS
NVIDIA GeForce RTX 4060 Mobile 11.61 TFLOPS
Intel Arc B570 11.52 TFLOPS
NVIDIA GeForce RTX 3060 Mobile 10.94 TFLOPS
NVIDIA GeForce RTX 3050 8GB 9.098 TFLOPS
NVIDIA GeForce RTX 4050 Mobile 8.986 TFLOPS
NVIDIA GeForce RTX 3050 OEM 8.986 TFLOPS
NVIDIA GeForce RTX 3050 6GB Mobile 7.639 TFLOPS
NVIDIA GeForce RTX 3050 6GB 6.774 TFLOPS
NVIDIA GeForce RTX 3050 4GB Mobile 6.18 TFLOPS
NVIDIA GeForce RTX 3050 Ti Mobile 5.299 TFLOPS
NVIDIA GeForce RTX 3050 A Mobile 4.813 TFLOPS
AMD Radeon 740M 2.56 TFLOPS
Intel UHD Graphics 730 N/A

显卡FP32浮点性能计算方法

显卡的 FP32 浮点性能（单位是 TFLOPS）可以大致通过以下公式估算：

FP32 性能（TFLOPS） = CUDA核心数 × 主频 × 每个时钟的操作数 × 2（如果是 FMA 指令） ÷ 1,000,000

以 NVIDIA RTX 3080 为例，它的 CUDA核心数：8704，主频：1.71 GHz，根据公式计算：8704 × 1.71 × 2 ≈ 29.77 TFLOPS，这就意味着 RTX 3080 每秒大约能进行 29.77 万亿次 FP32 运算。

显卡FP32浮点性能的意义

游戏更依赖的是图形渲染能力（光栅/着色器等），FP32 性能虽然相关，但不是决定性因素，但它确实影响一些高负载的图形计算，比如光线追踪、物理模拟等。

AI/深度学习方面，FP32 性能直接影响神经网络的前向推理和训练速度，但现在更高效的是 FP16 或更低精度的混合精度计算（Tensor Core 支持）。

科学计算 / 工业仿真的高精度需求场景下，FP32 是基本门槛，有些任务还要求 FP64，更适合专业卡如 NVIDIA A100、Quadro 系列。