GeForce GTX 1070首发评测 极致性价比(4)

2016-05-30 06:00:00 来源:中关村在线作者:赵剑楠 人气: 次阅读 831 条评论

前不久,我们为大家带来了NVIDIAGeForceGTX1080显卡的评测,作为Pascal架构的首款产品,GTX1080的性能确实没有令我们失望,其综合性能大幅领先上代旗舰GTXTitanX,成为了NVIDIA游戏显卡的新标杆。然而这款显卡高。...

第四代delta色彩压缩技术

  显存压缩技术对于提高显卡性能是很有帮助的。同之前的NVIDIAGPU一样,全新的GTX1070也采用了这样一种无损压缩技术。这种技术有以下几点好处:减少显存数据写入量;减少数据从显存到GPU二级缓存的数据传输量,有效增加了GPU二级缓存的容量以及降低纹理单元和帧缓存间的数据传输量。

缔造性能神话 GeForce GTX 1080首发评测
第四代delta色彩压缩技术

  显存压缩技术中最重要的一种就是“delta色彩压缩技术”,这种技术让GPU计算每一个块中像素的差异,然后将相同色彩的像素信息进行压缩,在极端状况下,压缩储存后的参考像素还不及未经压缩像素一半的大小,这无疑大大减小了数据传输量。

异步运算技术

  从传统角度上看,GPU主要承担的任务是图形渲染,系统会将待处理的工作按照指定流程传递给GPU,以便让图像能够以正确的顺序显示出来,这点对于图形渲染来说非常重要。而现如今随着GPU功能的不断挖掘以及架构的不断升级,许多计算、复制的工作也会交由GPU来做,如果仍然只有一条序列的话,渲染、计算、复制三项任务将会互相抢占,造成“交通拥堵”,运行效率自然大打折扣。因此多条序列分别处理渲染、计算、复制等工作才能大大提升GPU效率,这种技术就是异步运算技术。

  说起异步运算技术,大家可能会首先想到AMD的GCN架构,GCN的异步着色器技术让GCN架构的A卡在DX12中拥有了出色的性能表现。随着DX12时代的全面到来,NVIDIA的全新GTX1070自然也是在异步运算上狠下功夫。官方宣称,GTX1070有着完全的异构计算能力,借助异构着色器,GPU可以并行处理多任务,而非按优先级进行候选或者抢占。

缔造性能神话 GeForce GTX 1080首发评测
动态负载平衡技术

  首先为大家介绍的是Pascal架构引入的全新技术――动态负载平衡。为了让大家能够更直观地了解这项技术,我们看上面这张图:横坐标是时间,纵坐标是GPU资源分配百分比,浅绿色是图形工作量,深绿色部分是计算工作量,而灰色斜纹部分为空闲。首先看上半部分的静态平衡,如果计算工作量所需的时间比图形工作量的时间长,而两个工作需要同时完成才能进行新的工作,那么进行图形工作的GPU就会有一部分闲置出来,这就浪费了GPU的性能;接着我们看下图的动态平衡,当计算工作量先完成时,负责计算工作的GPU资源就会去帮助完成剩余的图形工作,这样就不会有闲置的GPU资源,并且大大降低了工作所需的时间,这就是Pascal的动态负载平衡技术。

缔造性能神话 GeForce GTX 1080首发评测
Pascal架构的抢占技术

  然后是有关GPU抢占的技术。了解VR的朋友们一定听说过“异步时间扭曲”技术,异步时间扭曲是指在一个线程(称为ATW线程)中进行处理,这个线程和渲染线程平行运行(异步),在每次同步之前,ATW线程根据渲染线程的最后一帧生成一个新的帧。(有关异步时间扭曲的知识请参见《小菜硬件杂谈说说VR里的异步时间扭曲》)实现异步时间扭曲需要GPU支持合理的抢占粒度,那么抢占指的是什么意思呢?所谓抢占,就是指为了使重要工作得以快速运行,GPU会选择性关闭不太重要的工作,从而提高重要工作的运行效率。Pascal架构是史上首个支持像素级抢占的GPU架构,当接收抢占请求时,Pascal的图形单元会记录下那些优先级较低的工作被中断时的位置,优先处理那些重要的工作;当抢占结束后,其余的工作从之前被中断的位置开始继续执行。

缔造性能神话 GeForce GTX 1080首发评测
抢占在VR中的应用――异步时间扭曲(ATW)技术

  Pascal的抢占不仅作用于图形工作中,在计算工作中也可以实现。线程级的抢占和像素级抢占的实现方式类似,都是停下当前优先级较低的线程块的工作,去支援优先级较高的SMs运算线程,当抢占结束后,从之前中断的地方开始继续计算工作。对于游戏来说,像素级抢占和线程级抢占相结合让Pascal架构GPU可以以极快的速度和最小的性能开销实现抢占,同时对于CUDA计算任务,Pascal也可以以最好的抢占粒度去实现抢占。

FastSync技术

  FastSync是一种替代传统垂直同步的防止画面撕裂的技术。同V-Sync不同的是,开启FastSync后,在做到防止画面撕裂的同时能够不降低显卡的性能,也就是说FastSync能够实现V-Sync开启时的流畅画面,并且有着如同未开启V-Sync一样的低延迟。从下图可以看出,FastSync的延迟仅比关闭V-Sync时的延迟多了8ms,这点差距还是十分令人满意的。最后,FastSync技术可以搭配G-Sync技术一起使用,为玩家带来更好的视觉效果。

缔造性能神话 GeForce GTX 1080首发评测
FastSync和V-Sync延迟对比

GPUBoost3.0

  GPUBoost是NVIDIA推出的GPU动态提速技术,能够在TDP允许的范围内,尽可能地提高GPU运行频率,进而提升GPU工作效率。全新的GTX1070为我们带来了这个技术的最新升级版――GPUBoost3.0。GPUBoost3.0可以设置各个电压点的频率偏移。GPUBoost2.0及以前的版本只能实现固定的频率偏移,也就是说频率的提升只能呈线性的方式,提升后的频率无法达到此电压下对应的最大频率。

缔造性能神话 GeForce GTX 1080首发评测 缔造性能神话 GeForce GTX 1080首发评测
GPUBoost2.0与3.0之间的区别

  GPUBoost3.0就很好地解决了这个问题,频率偏移可以对应到单个电压点,而不是像之前的线性相关,这样就可以使得GPU的频率达到该电压下所能实现的最大值,大大提升了GPUBoost的效果。全新的GPUBoost3.0还能与超频软件相结合,让玩家可以手动调整频率偏移曲线,来达到理想的GPU频率。

您可能感兴趣的文章

    无相关信息

相关文章