[返回手机数码首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[坛主管理]

比职业玩家反应更快 NVIDIA Reflex是怎么做到的?

送交者: An4dy[♂★★★声望勋衔14★★★♂] 于 2021-04-23 14:09 已读 427 次  

An4dy的个人频道

+关注

英雄联盟世界总决赛S10正打得如火如荼,光是围观比赛就足以让人热血沸腾。无论自己游戏水平如何,许多玩家都会怀揣着赢下一盘游戏的想法,在虚拟世界与对手一决高下。



问题就在于如何赢。看过武侠小说的朋友都听说过“天下武功唯快不破”,重点就在一个“快”字。为了在游戏中快起来,很多小伙伴购买了高刷新率的显示器,响应更快的鼠标和键盘,以及更好的电脑配置和显卡。




事实上,近两年新推出的显卡足够已经能轻松应付大多数线上对战游戏,动辄上百FPS的刷新率配合高刷新显示器,在一秒钟内,就能给玩家提供庞大的信息量。但有时候,我们仍然会感到有些力不从心,明明按下了鼠标左键,却总比预判晚了一点。





成为人体描边大师有时候未必真的是你的错,GPU一秒内制造出来的数百帧游戏画面,有时候会给电脑配件,特别是CPU造成成吨的压力,鼠标发出的指令未必能第一时间到达游戏世界中,呈现在显示画面上。




为了更进一步解决电竞级响应的问题,NVIDIA Reflex技术紧跟着GeForce RTX 30系列显卡同步推出,它是一整套解决游戏延迟的技术,需要软硬件平台以及驱动同步支持才行。而最新发布的360Hz刷新率的电竞G-Sync显示器还内建了延迟分析器,可以让你更系统化的量化电竞游戏中的延迟数据。Reflex同样也可以在GeForce RTX 20系列、GeForce GTX 16系列显卡上生效并降低延迟。




听起来是不是有些高深?现在我们就来详细说说NVIDIA Reflex技术是如何让玩家获得电竞级反应的。




一切从系统延迟说起








在提及NVIDIA Reflex技术如何实现之前,我们先从系统延迟说起。




当你按下鼠标或者键盘,再到显示器上做出反应,是一个十分复杂的过程。鼠标输入的指令会先到达CPU,然后进入渲染队列,再由GPU处理最终在显示器执行显示,每一个步骤都存在延迟。





看起来似乎也不算太复杂?上图其实只给你看了个大概,下面这张端到端的系统延迟图才是一个比较完整的延迟流程,具体如下:





第一部分延迟的是输入延迟。也就是我们常看到键盘、鼠标、手柄的外设延迟;


第二部分延迟是输入采样延迟。输入采样是指计算机本身从输入设备接收输入信息,然后将其发送到游戏,以便处理输入和位置等信息。同时这个部分还包含游戏引擎延迟,诸如视觉效果、音频、本地模拟、能见度等特效都会造成引擎延迟;


第三部分是渲染延迟。这个延迟由渲染队列和GPU共同影响。


第四部分是合成延迟。窗口合成程序获取帧之后,会安排与其他窗口合成,从而造成延迟。这时候我们可以通过全屏独占模式来避免窗口合成,以减少延迟;


第五部分是显示延迟。显示延迟实际上包含三个部分:


1)扫描输出率。指将GPU渲染的帧缓冲区扫描到显示器中所使用的时间。它受到显示器刷新率,也就是我们常说的XXXHz刷新率影响,速率越快,用时越短;


2)显示处理。指HDR处理、G-SYNC等等效果追加。为了达到更好的画质,一些电视会积累多个帧,因此非主打游戏的电视,通常这部分的延迟会相当大;


3)像素响应时间,也就是灰阶响应时间。这部分指像素收到输入信息时响应并改变颜色所用的时间,这一点已经被各显示器厂商作为重点宣传对象。





有意思的是,玩家们最为熟悉的游戏帧数FPS与较低的系统延迟有关,但是这种关系并非永远对等。事实上在无法有效简单表达游戏响应的前提下,通过FPS每秒帧数来表达游戏画面的吞吐率,也较为方便更多人理解。而真正能表现出游戏响应速度,正式前面提到的系统延迟。




举个栗子。如果我们拥有一台可以每秒渲染1000FPS的PC,但是接入了一个长长长长长的流程,要1秒钟才能到达显示器,这个时候我们有效击中对手的概率将会十分低下。






而在流程的内部,出现帧与帧之间排队也是司空见惯的。例如游戏引擎与渲染器上的最终GPU工作之间,实际上有数个待处理的帧正在排队,从而造成了延迟,这时候可能是GPU处理帧的速度赶不上CPU提交渲染请求的速度,这样就造成了CPU的反压。因此适当的丢掉一些无效的渲染请求就可以优化延迟。




同样,在受CPU限制下,GPU也必须等待CPU的指令,造成GPU的资源浪费。此时GPU通常会降频以节省电力。而在CPU负载得到缓解的情况下,GPU再提频,此时也会造成少许的延迟。Reflex可以强制GPU一直运行在高频率下,以确保延迟的最低化。





再简单一些,通过下面这张表达不太确切的图,大家大致感受一下:





如果说提升FPS是最简单直接的方式,那么通过NVIDIA Reflex技术缩减系统延迟的时间,就是一个巧妙的方式,缓和了CPU与GPU之间的尴尬处境,消除GPU渲染队列。这项技术与Ultra Low Latency Mode极限低延迟模式类似,但它更为直接植入到了游戏和硬件中,利用Reflex SDK获得比通过驱动实现的极限低延迟更好。





本质上,NVIDIA Reflex SDK能够更好的控制CPU的运行速度,允许及时向GPU提交例如点击鼠标的关键动作,同时还确保GPU没有间断运行,保证画面的流畅输出。





因此在NVIDIA Reflex技术中,开发人员是可以动态调整GPU的渲染工作,有效的降低输入延迟和采样,并且对输入环节感知更为敏感。支持Reflex技术的鼠标连在显示器上,还可以通过延迟分析器获取鼠标的延迟信息。




把鼠标插在显示器上!








打下理论基础,现在有请我们的硬件登场。目前包括ROG Swift 360Hz PG259QNR、Acer Predator X25、MSI Oculux NXG253R、Alienware 25 Gaming Monitor AW252H在内的显示器,以及ROG Chakram Core、Logitech G Pro Wireless、Razer Deathadder v2 Pro、SteelSeries Rival 3在内的鼠标已经支持NVIDIA Reflex技术。





这里我们搬出ROG全家桶,即ROG Swift 360Hz PG259QNR显示器和ROG Chakram Core鼠标。显卡包括GeForce RTX 3090 Founders Edition、GeForce RTX 3080 Founders Edition,以及GeForce GTX 1660 Super。





其他配置如下:




CPU:Core i9-10900K


主板:ROG MAXIMUS XII Extreme


内存:Thermaltake DDR4-4600 8GB x2




同时我们将GeForce Experience升级到最新版本,开启实验性功能和游戏内覆盖选项。





顺带一提,新版本GFE还加入了性能监控模式:





另外在NVIDIA控制面板-管理3D设置-全局设置中开启“低延时模式”和关闭“垂直同步”。





同时鼠标的安装也颇为讲究,需要插在显示器下方的橙色USB Type-A口,同时显示器通过一个USB线缆与PC连接。





需要注意的是,这时候鼠标与显示器NVIDIA Reflex Latency Analyzer功能处于联动状态,一旦关闭此项功能,鼠标也会和PC断开连接。





装上显示器和鼠标,安装就算基本完成了。



提升了多少?








接下来我们需要测试出NVIDIA Reflex究竟给系统延迟降低了多少。




ROG Swift 360Hz PG259QNR配备了独立的G-SYNC Processor选项,子项目下包含了NVIDIA Reflex Latency Analyzer和NVIDIA ULMB两个。这里打开第一个NVIDIA Reflex Latency Analyzer,并勾选所有显示项目。





这时候会看到屏幕左上角会出现屏幕刷新率和检测到的系统延迟,同时屏幕中央出现一个色块,用于检测亮度变化的区域。在实际使用中,检测程序对高亮的枪口火舌更为敏感,因此需要寻找火舌较为明显的武器进行测试。或者选择明暗切换明显的边缘,比如打开瞄准镜时的瞄准镜边缘。





在游戏选择上,选择了《Valorant》、《Apex英雄》、《COD:战区》、《堡垒之夜》四款游戏作为参考,原因是目前这四款游戏均已在设置中支持NVIDIA Reflex技术开启和关闭。很快,《COD:黑色行动冷战》、《命运2》、《厨房大逃杀》、《枪法模拟器Kovaak 2.0》等游戏都会加入对NVIDIA Reflex的支持。




从目前来看,不同游戏的设置基本相当,都给了NVIDIA Reflex独立设置选项,提供关闭、开启、开启+Boost三档,其中最后一档主要是为了CPU也时刻保持高速运作模式,禁用省电功能,有利于减少延迟。





另外,《堡垒之夜》还特意在屏幕左侧设置了一个闪光区,与子弹出膛同时出现,并处在屏幕左侧,方便检测程序抓取。




为了保证游戏流畅运行,GeForce GTX 1660 Super使用了基本画质,确保游戏能达到100FPS以上的刷新率,而GeForce RTX 3090 Founders Edition、GeForce RTX 3080 Founders Edition性能足够,直接使用了最高画质,并开启DLSS。





可以看到,即使在最高画质下,RTX 3090和RTX 3080的系统延迟已经足够低,而一旦开启NVIDIA Reflex模式,延迟会有数毫秒到数十毫秒的降低。





相比之下,GTX 1660 Super提升更为明显,特别是《堡垒之夜》,延迟降低已经接近一半。





GTX 1660 Super获得低延迟一方面来自通过降低画质获得更高的FPS,另一方面则是高刷新率的显示器给出了更好的反馈。可见,即使是入门级显卡,高刷新率显示器仍然可以带来更快的游戏响应。而在此基础上,NVIDIA Reflex技术的加持,也能够让GTX 1660 Super延迟变得更低。



最后:往高手更进一步








系统延迟发生仅仅在千分之几十秒内发生,但对于电竞玩家而言已经格外重要。最出名的例子莫过于FPS玩家的晃动窥视,通过在墙角反复横移刷新准心画面,事实上会比对手先发现对方,额外30到40毫秒的优势,足够给电竞选手留下了发挥的空间。





同样,更低的系统延迟意味着输入信息能够更快的体现在显示器上,连续的点击会在短时间内潜意识修正,从而弹道更为集中。这不是开玩笑,更快的刷新率和更低的延迟,将会提升选手的训练水平,这已经得到了大数据的研究验证。





而对于玩家而言,几十毫秒的提升可能不会影响感知。但实际上积少成多,系统延迟和网络延迟的降低能够带来更好的竞技体验。





同样,ROG Swift 360Hz PG259QNR显示器和ROG Chakram Core鼠标也给人留下了深刻的印象,前者360Hz IPS屏幕在整个游戏体验中相当舒服,ROG Chakram Core鼠标也是首批支持NVIDIA Reflex技术的鼠标中,延迟可以压缩到0.5毫秒之内,表现最强的。





所以在配置GeForce RTX 30系列显卡新电脑的时候,大家应该可以知道购买什么样的配件了。

喜欢An4dy朋友的这个贴子的话, 请点这里投票,“赞”助支持!

内容来自网友分享,若违规或者侵犯您的权益,请联系我们

所有跟帖:   ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名: 密码: [--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助

打开微信,扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮

楼主前期社区热帖:

>>>>查看更多楼主社区动态...



[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 创建您的定制新论坛频道 ] [ Contact us ]