网站首页 > 资源文章 正文
RTX 30显卡的在线发布会上有一个细节特别引人瞩目,那就是公布了一个名为TFLOPS的数据时,如果大家收看的视频有弹幕,一定马上就会弹幕爆炸了。这个参数到底是啥?为什么让大家那么关注呢?咱们今天就来说说吧。
TFLOPS是Tera和Floating-point operations per second词组的组合,后者的意思是每秒浮点运算次数,Tera则是万亿的意思,合起来就是每秒浮点运算多少万亿次。因为现在的图像是分成像素点来处理的,每个点的色彩都要进行浮点运算,然后组合成一幅图片,所以这个参数就说明了显卡或者GPU每秒能处理多少个像素点。
它的基础就来自现在的GPU设计,目前的GPU都是由很多小处理核心或者叫流处理器组成,这个核心比处理器核心简单得多,每个时钟周期只负责处理一个浮点数据,所以总的浮点运算次数就是核心数量×时钟周期了。又因为现在的核心可以一次性处理一个双精度浮点数据,它相当于两个最基础的单精度浮点数据,所以再×2就得到了GPU的浮点运算次数。
回过头来看看这个参数对游戏有啥意义。在分辨率确定后,每一幅画面的像素点数量也就确定了,那么每秒处理的像素点越多,实际上每秒能处理的画面数量当然就越多。这说明了啥?当然就是游戏的帧速(每秒画面数)越高啦。没错,对使用同一代特别是同一核心的显卡,算出它的浮点运算能力,基本就了解游戏速度了。
不过对于不同代甚至不同架构的GPU,这种对比就不合适了,比如RTX 3080拥有两倍于RTX 2080 Ti的浮点运算次数,帧速能达到RTX 2080 Ti的两倍吗?从之前的测试大家就知道,当然不是这样。
这就牵扯出了另一个问题,也就是核心的效率,因为谁也不能保证所有的核心或者流处理器能一直满载、有效运行,它的实际发挥还要考虑到前端的分配、后端的合成、显存数据等单元的配合,所以设计不同的架构下,按照最理想情况算出的浮点运算次数能发挥多少也是不同的。
RTX 30还有所不同,因为它实际上是让每个核心中的整数运算单元也参加浮点运算,造成了“理论”运算能力翻倍、但因为干的是非专业工作,整数单元的浮点运算效率肯定赶不上专业的浮点运算单元,再加上前端的数据分配能力、显存带宽啥的没有跟着翻倍,所以效率大幅下降,最终我们可以看到,翻倍的浮点运算能力带来的只是不到40%的实际帧速提升。
既然同一个厂家在架构上的改动都会造成浮点运算能力的实际发挥,AMD和NV这种相差更远的架构就别提了,比如RX 6800系列用了比较特殊的架构设计,就以远低于RTX 3080/3070的浮点运算能力,得到了能抗衡甚至压制它们的性能。
猜你喜欢
- 2025-04-05 Xbox X硬件规格:12 TFLOPS/快速恢复/支持120帧
- 2025-04-05 最前线 | 特斯拉超算Dojo下月投产,24年末年算力可达 100 Exa-Flops
- 2025-04-05 广东:到2025年,全省算力规模超过40EFLOPS
- 2025-04-05 “东数西算”让数字化“脚步”更快更稳
- 2025-04-05 NVIDIA将推氢弹级7nm安培GPU 性能提升100%不是梦
- 2025-04-05 广东:到2025年全省算力规模超过40EFLOPS,人工智能核心产业规模超过3000亿元
- 2025-04-05 计算芯片算力详解-TOPS、FLOPS(芯片算力tops对比)
- 2025-04-05 FLOPS解释,计算和实际应用,以及典型设备的FLOPS
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- 电脑显示器花屏 (79)
- 403 forbidden (65)
- linux怎么查看系统版本 (54)
- 补码运算 (63)
- 缓存服务器 (61)
- 定时重启 (59)
- plsql developer (73)
- 对话框打开时命令无法执行 (61)
- excel数据透视表 (72)
- oracle认证 (56)
- 网页不能复制 (84)
- photoshop外挂滤镜 (58)
- 网页无法复制粘贴 (55)
- vmware workstation 7 1 3 (78)
- jdk 64位下载 (65)
- phpstudy 2013 (66)
- 卡通形象生成 (55)
- psd模板免费下载 (67)
- shift (58)
- localhost打不开 (58)
- 检测代理服务器设置 (55)
- frequency (66)
- indesign教程 (55)
- 运行命令大全 (61)
- ping exe (64)
本文暂时没有评论,来添加一个吧(●'◡'●)