帧率暴涨40%,老显卡也能吃上!微软这次花活儿太炸了

早在2018年,老黄从兜里掏出了RTX 20系显卡,并顺势在消费级显卡领域推出了硬件级光追概念,也就是我们常说的DLSS大力水手,以及光线追踪(DXR)。
DLSS不过多介绍了,在没有帧生成出现前,它的DLAA(深度抗锯齿)以及SR(超分辨率)是广受好评。
不过光追就不一样了,因为光追带来的模拟真实世界的光线物理行为(反射、折射、阴影、全局光照)确实对游戏画质真实性有飞一般的提升。
比如最近的《生化危机9:安魂曲》,你能看出这是同一个人吗...
r/PHGamers - RE Requiem - Rasterization vs Ray Tracing vs Path Tracing
因为其巨大的性能开销,在国内以网络游戏为主旋律的环境下,它在玩家眼里依然是「开了掉帧,不开浪费」的鸡肋功能。
不过,微软最近的一波更新,带来了新的转机。
在不久前微软正式发布了 DirectX 12 Agility SDK (v1.619),其中最核心的黑科技就是 SER(Shader Execution Reordering,着色器执行重排序)。
按照微软实验室给出的数据,在特定环境下,这项技术能让显卡在开启光线追踪的情况下的渲染性能暴涨 90%。即便是实机游戏,像《赛博朋克 2077》这种「显卡杀手」,开启后也能白捡 25% - 30% 的帧率。
看到这可能有同学不理解了:NVIDIA 都没搞定的微软怎么搞出来的?这性能难道是凭空变出来的?
在传统的光追渲染流程中,光线射向物体后会随机乱飞,有些去撞墙,有些去水面,计算任务极其凌乱。
这种「发散性」是显卡的噩梦,因为 GPU 的特长是并排处理一堆相似的任务。一旦任务变乱,显卡的计算单元就会出现大规模的闲置和等待,效率低得离谱。
而 SER 做的,就是在显卡正式开工前,把这些乱序的任务进行实时重排序。它把射向相似方向、需要执行相似代码的光线打包成一篮子,再一股脑塞进 GPU 里。
显卡干活顺手了,效率自然就上去了。翻译成人话就是:渲染光追画面就好比织毛衣,以前是乱糟糟的毛线球到处缠绕,现在微软帮 GPU 理成了顺滑的线圈。让 GPU 并行效率拉满,减少无效等待与数据访问冲突。
在延迟方面也下降了 30% 左右。
适配方面,根据微软自己的 Demo 演示,RTX 50 系因为原生适配 SER,光追场景平均帧数提升超过了 40%,RTX 5080 提升幅度甚至冲到了 80%
RTX 40 系平均也在 40% 左右。
至于更老一点的 RTX 20 和 30 系列,虽然硬件上没有专门的「分拣开关」,但通过这次 SDK 更新,开发者可以用软件模拟的方式实现类似效果。虽然提升没那么夸张,但对于挣扎在 30 帧边缘的玩家来说,这几帧的优化可能就是「能玩」和 PPT 的区别。
而 intel 在之中受益最大,Arc B 系列显卡在测试中出现了 90% 的性能飞跃,成为受益最大的一家,不过倒是 AMD 这边完全没有相关的消息。
有意思的是,在 JPR 刚刚公布的上个季度独立显卡市占率中,AMD 的份额再次缩小到 5%,为历史最低。NVIDIA 以 94% 的份额独占鳌头。
intel 则是逐渐站稳了这 1%。
不过大伙儿也先别着急喊着 intel 战未来。
虽然看着挺香,但目前还没有正式游戏支持,预计从下半年会开始陆续加入。尽管微软已经把它整合进 DX12 标准,不需要游戏大改特改,但还是得做相关适配,时间上没那么快。
毕竟一大堆游戏还在 DX11 呢。
至于正式发布后会不会成为开启「全民光追」的开头,咱们就拭目以待吧。
数据素材来源:微软、NVIDIA、JPR、索泰,图源网络。


本文编辑:@ 阿红

©本文著作权归电手所有,未经电手许可,不得转载使用。