第1页:NVIDIA Pascal次旗舰新品发布
前不久,我们为大家带来了NVIDIA GeForce GTX 1080显卡的评测,作为Pascal架构的首款产品,GTX 1080的性能确实没有令我们失望,其综合性能大幅领先上代旗舰GTX Titan X,成为了NVIDIA游戏显卡的新标杆。然而这款显卡高达5399元的价格也令广大玩家们望而却步,将目光转投在了Pascal架构的另一款产品上,它就是我们今天的主角——NVIDIA GeForce GTX 1070。

作为GTX 1080的同门师弟,GTX 1070采用了相同的新一代公版涡轮散热器,并且在显卡接口一侧标有“GTX 1070”字样。这款显卡的公版售价为3499元,官方建议的非公版售价为2899元起。虽然从价格上来看,GTX 1070相比上一代同级别产品GTX 970提升了不少,但如果在性能上真如NVIDIA官方宣称的那样,可以与GTX 980 Ti甚至GTX Titan X一绝高低的话,相信还是有不少玩家愿意为此买单的。毕竟仅需3000多元就能体验到上代旗舰产品的性能,在目前硬件市场中是很罕见的。
NVIDIA GeForce GTX 1070
第2页:GeForce GTX GTX 1070参数解析
GTX1070参数解析
GeForce GTX 1070采用了两年前就已在GTC上被老黄透漏的全新架构——Pascal,“Pascal”依然取自一位著名物理学家的名字,国际单位制中压力的单位“Pa”即以其姓氏命名。Pascal架构的第一款产品是4月初发布的Tesla P100,其采用GP100大核心,而这次发布的GTX 1080则是采用GP104核心,具体型号为GP104-400,次旗舰GTX 1070为GP104-200。GP104核心面积约为314平方毫米,得益于16nm的制程优势,核心内集成了72亿晶体管,是GTX 980晶体管数量的1.38倍,核心面积却仅为GTX 980的78.9%。
第四代delta色彩压缩技术显存压缩技术中最重要的一种就是“delta色彩压缩技术”,这种技术让GPU计算每一个块中像素的差异,然后将相同色彩的像素信息进行压缩,在极端状况下,压缩储存后的参考像素还不及未经压缩像素一半的大小,这无疑大大减小了数据传输量。
异步运算技术从传统角度上看,GPU主要承担的任务是图形渲染,系统会将待处理的工作按照指定流程传递给GPU,以便让图像能够以正确的顺序显示出来,这点对于图形渲染来说非常重要。而现如今随着GPU功能的不断挖掘以及架构的不断升级,许多计算、复制的工作也会交由GPU来做,如果仍然只有一条序列的话,渲染、计算、复制三项任务将会互相抢占,造成“交通拥堵”,运行效率自然大打折扣。因此多条序列分别处理渲染、计算、复制等工作才能大大提升GPU效率,这种技术就是异步运算技术。
说起异步运算技术,大家可能会首先想到AMD的GCN架构,GCN的异步着色器技术让GCN架构的A卡在DX12中拥有了出色的性能表现。随着DX12时代的全面到来,NVIDIA的全新GTX 1070自然也是在异步运算上狠下功夫。官方宣称,GTX 1070有着完全的异构计算能力,借助异构着色器,GPU可以并行处理多任务,而非按优先级进行候选或者抢占。
动态负载平衡技术
首先为大家介绍的是Pascal架构引入的全新技术——动态负载平衡。为了让大家能够更直观地了解这项技术,我们看上面这张图:横坐标是时间,纵坐标是GPU资源分配百分比,浅绿色是图形工作量,深绿色部分是计算工作量,而灰色斜纹部分为空闲。首先看上半部分的静态平衡,如果计算工作量所需的时间比图形工作量的时间长,而两个工作需要同时完成才能进行新的工作,那么进行图形工作的GPU就会有一部分闲置出来,这就浪费了GPU的性能;接着我们看下图的动态平衡,当计算工作量先完成时,负责计算工作的GPU资源就会去帮助完成剩余的图形工作,这样就不会有闲置的GPU资源,并且大大降低了工作所需的时间,这就是Pascal的动态负载平衡技术。
Pascal架构的抢占技术
然后是有关GPU抢占的技术。了解VR的朋友们一定听说过“异步时间扭曲”技术,异步时间扭曲是指在一个线程(称为ATW线程)中进行处理,这个线程和渲染线程平行运行(异步),在每次同步之前,ATW线程根据渲染线程的最后一帧生成一个新的帧。(有关异步时间扭曲的知识请参见《小菜硬件杂谈 说说VR里的异步时间扭曲》)实现异步时间扭曲需要GPU支持合理的抢占粒度,那么抢占指的是什么意思呢?所谓抢占,就是指为了使重要工作得以快速运行,GPU会选择性关闭不太重要的工作,从而提高重要工作的运行效率。Pascal架构是史上首个支持像素级抢占的GPU架构,当接收抢占请求时,Pascal的图形单元会记录下那些优先级较低的工作被中断时的位置,优先处理那些重要的工作;当抢占结束后,其余的工作从之前被中断的位置开始继续执行。
Pascal的抢占不仅作用于图形工作中,在计算工作中也可以实现。线程级的抢占和像素级抢占的实现方式类似,都是停下当前优先级较低的线程块的工作,去支援优先级较高的SMs运算线程,当抢占结束后,从之前中断的地方开始继续计算工作。对于游戏来说,像素级抢占和线程级抢占相结合让Pascal架构GPU可以以极快的速度和最小的性能开销实现抢占,同时对于CUDA计算任务,Pascal也可以以最好的抢占粒度去实现抢占。
Fast Sync技术
Fast Sync是一种替代传统垂直同步的防止画面撕裂的技术。同V-Sync不同的是,开启Fast Sync后,在做到防止画面撕裂的同时能够不降低显卡的性能,也就是说Fast Sync能够实现V-Sync开启时的流畅画面,并且有着如同未开启V-Sync一样的低延迟。从下图可以看出,Fast Sync的延迟仅比关闭V-Sync时的延迟多了8ms,这点差距还是十分令人满意的。最后,Fast Sync技术可以搭配G-Sync技术一起使用,为玩家带来更好的视觉效果。
Fast Sync和V-Sync延迟对比
GPU Boost 3.0
GPU Boost是NVIDIA推出的GPU动态提速技术,能够在TDP允许的范围内,尽可能地提高GPU运行频率,进而提升GPU工作效率。全新的GTX 1070为我们带来了这个技术的最新升级版——GPU Boost 3.0。GPU Boost 3.0可以设置各个电压点的频率偏移。GPU Boost 2.0及以前的版本只能实现固定的频率偏移,也就是说频率的提升只能呈线性的方式,提升后的频率无法达到此电压下对应的最大频率。
GPU Boost 2.0与3.0之间的区别GPU Boost 3.0就很好地解决了这个问题,频率偏移可以对应到单个电压点,而不是像之前的线性相关,这样就可以使得GPU的频率达到该电压下所能实现的最大值,大大提升了GPU Boost的效果。全新的GPU Boost 3.0还能与超频软件相结合,让玩家可以手动调整频率偏移曲线,来达到理想的GPU频率。
第5页:显卡拆解赏析
显卡拆解赏析首先我们来看一下GeForce GTX 1070的拆解赏析:
GeForce GTX 1070
显卡正面
显卡散热器
显卡背板
显卡正面拆解
显卡背面拆解
显卡PCB
显卡核心
显卡信仰灯
辅助供电接口
视频接口
Founders Edition包装盒从外观来看,除了散热器标注型号上的区别之外,GTX 1070和GTX 1080并无不同。而GTX 1080采用的是GP104-400核心,GTX 1070则使用了GP104-200核心。显存方面,GTX 1070和上代产品一样,使用的都是GDDR5显存,并没有使用全新的GDDR5X。
第6页:测试平台环境一览
测试平台硬件环境一览为保证测试能够发挥显卡的最佳性能,本次测试平台采用最强酷睿芯——Intel酷睿i7-5960X处理器、技嘉X99芯片组主板、海盗船 VENGEANCE LPX 4*8GB DDR4-2666MHz 四通道内存、安钛克750w金牌电源组建而成。详细硬件规格如下表所示:
测 试 平 台 软 硬 件 配 置核心配件CPUIntel酷睿i7-5960X主板技嘉GA-X99-Gaming G1 WIFI核芯显卡无无内存海盗船8GB DDR4-2666 x4硬盘影驰战将系列240G电源安钛克TP-750C系统及驱动程序操作系统Microsoft Windows 10主板驱动Intel芯片组驱动显卡驱动NVIDIA GeForce Game Ready Driver(368.19Beta)DirectX环境DirectX 12帧数监控Fraps 3.5.1 or Benchmark
测试用主板:技嘉GA-X99-Gaming G1 WIFI
测试用内存:海盗船 VENGEANCE LPX(示意效果)
测试平台软件环境一览为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 10正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。
测 试 平 台 软 件 环 境操作系统Microsoft Windows 10 专业版(64bit / 版本号:10240)主板芯片组驱动Intel Chipset Device Software(WHQL / 版本号:9.2.3.1022)显卡驱动NVIDIA GeForce Game Ready Driver(版本号:368.19 Beta)桌面环境Microsoft Windows 10 专业版(2560×1440 / 32bit / 60Hz)在测试成绩方面,理论性能测试用得分来衡量性能,数值越高越好;游戏性能测试用游戏自带Benchmark及游戏中平均帧数来衡量性能,数值同样越高越好。
第7页:理论性能测试:3DMark 11
理论性能测试:3DMark 11
在进行游戏测试之前,自然是要用权威的软件来看看新卡的实力,首先是有资历的3DMark 11。3DMark 11使用原生DirectX 11引擎,包含四个图形测试项目,一项物理测试和一组综合性测试,并提供了Demo演示模式。该测试程序使用了Bullet物理引擎,使用原生DirectX 11引擎,在测试场景中应用了包括Tessellation曲面细分、Compute Shader以及多线程在内的大量DX11新特性。
3DMARK 11
从3DMark 11的测试当中不难看到,本次参与测试的GTX 1070的得分已经与上代旗舰产品GTX Titan X持平,并且领先GTX 980 Ti多达7%。这一结果究竟是偶然出现的,还是Pascal架构产品确实具备了强大的性能表现呢?然我们继续测试。
第8页:理论性能测试:3DMark FireStrike
理论性能测试:3DMark FireStrike
于北京时间2013年2月5日推出的新3DMark,采用全新界面设计,除了测试分数,还会展现每个场景测试期间的实时曲线,全程记录帧率、CPU温度、GPU温度、CPU功耗。新3DMark取消了传统的E、P、X模式,取而代之的是根据负载不同所推出的三个场景,其中FireStrike专为基于DirectX 11显卡搭建的高端游戏平台,而CloudGate则支持基于DirectX 10环境的主流硬件,IceStorm则支持入门级DirectX 9设备、手机、平板电脑等等。
3DMark FireStrike
在3DMark Fire Strike Extreme测试中,GTX 1070的表现稍逊色于GTX Titan X,略高于GTX 980 Ti。通过以上两项3DMark测试来看,全新的GTX 1070确实具备了挑战上代旗舰显卡的实力。不过仅靠理论性能测试并不足以证明这款产品的全部性能,下面我们就对GTX 1070进行游戏方面的实际应用测试。
第9页:游戏性能测试:《古墓丽影9》
游戏性能测试:《古墓丽影9》
《古墓丽影9》是由Crystal Dynamics开发,Square Enix负责发行的跨平台系列动作游戏,2013年3月开始发售。本作聚焦于劳拉年轻的时期,摒弃了前几作女超人的设定,玩家可以在游戏中看到更真实的劳拉年轻时代形象。由于引擎的升级,本作相比之前的作品会有更优秀的画面,是《古墓丽影》系列最具变革性的一作。
《古墓丽影9》
《古墓丽影9》2K平均帧数《古墓丽影9》是一个比较老的游戏了,不过在上市之初也算是一款硬件杀手级别的游戏。本次测试中,GTX 1070在1080P分辨率下的成绩相比GTX Titan X稍低,但在2K分辨率下又扳回一城。虽然整体上相比GTX 1080还有着不小的差距,但对于一款3000多元的显卡来说,能有这样的成绩实属不易。
第10页:游戏性能测试:《全境封锁》
游戏性能测试:《全境封锁》
《全境封锁》是一款开放世界第三人称射击角色扮演大型多人在线网络游戏。游戏设定在瘟疫爆发后的美国,玩家作为“全境封锁”计划的部队,在“黑色星期五”后的美国寻找一线生机。该作的大背景同《辐射》系列很类似,都是描绘大灾难后的世界,玩家需要在这个混乱的世界中寻找一线生机,可以说生存是玩家唯一的选择。
《汤姆克兰西:全境封锁》
《汤姆克兰西:全境封锁》2K平均帧数在《全境封锁》的游戏测试中,GTX 1070的性能排名有所下降,两分辨率的平均画面帧数均低于GTX 980 Ti,从之前的测试成绩来看,本次GTX 1070的排名降低应该和驱动及游戏优化有着一定的关系。不出意外,NVIDIA或是育碧在未来会推出针对这款新显卡的优化补丁,相信届时GTX 1070的排名会再度提升。
第11页:游戏性能测试:《巫师3:狂猎》
游戏性能测试:《巫师3:狂猎》
《巫师3:狂猎》采用Redengine3引擎,作为一款次世代的RPG游戏作品,本作栩栩如生的真实环境还原以及全新角色面部动作和人物面部表情都成为了一大亮点。Redengine3引擎在支持各种全新图形技术的同时也加快了地图载入速度,经由无缝地图打造的宏大世界让玩家可以自由无限制的漫游在游戏世界当中。
《巫师3:狂猎》
《巫师3:狂猎》2K平均帧数在《巫师3》的测试项目中,GTX 1070再次惜败GTX Titan X,并以微弱的优势领先于GTX 980 Ti。值得一提的是,GTX 1070在特效全开、2K分辨率下依然可以获得接近60帧的平均帧数,这对于目前2K分辨率显示器的普及是有一定帮助的,这样玩家在选购了2K显示器之后,才能获得更好的游戏体验,而再次之前由于显卡性能不足,导致购买2K显示器之后还要在分辨率或特效上进行妥协,才能流畅的进行游戏。
第12页:DX12性能测试:《奇点灰烬》
DX12性能测试:《奇点灰烬》
《奇点灰烬》是一款Stardock制作的即时战略游戏。该作采用Oxide Games的Nitrous引擎打造,背景设定在遥远的未来,那时人类完全以意识形态存在,人们已经掌握了上帝一样的力量。但是人类发现自己已经处于战争之中,敌人就是一个叫做“Haalee”的具有意识形态的AI,企图推翻人类在宇宙之中的统治地位。
《奇点灰烬》
《奇点灰烬》1080P平均帧数
《奇点灰烬》2K平均帧数
在DX12的游戏测试项目中,无论是1080P还是2K分辨率,GTX 1070都再次赶超了GTX Titan X,并且领先GTX 980 Ti平均帧数10%以上。相信在DX12游戏全面普及之后,GTX 1070能够带给玩家们更多的惊喜。
第13页:网游性能测试
网游性能测试
测试完典型的单机大作,我们来看看在网游中GTX 1070的表现。由于GTX 1070有着堪比旗舰级显卡的性能,因此我们选择的游戏是对显卡有着一定要求的《风暴英雄》和《魔兽世界》,而没有选择诸如LOL、CF等对显卡性能要求并不是很高的游戏,GTX 1070在不同分辨率下的表现如下:
《魔兽世界》
《守望先锋》不同分辨率下帧数表现通过以上测试我们可以看到,GTX 1070能够在主流分辨率下流畅运行特效全开的网络游戏,即便是将分辨率上调至4K,使用GTX 1070依然能够获得相对不错的游戏体验,这在以往的硬件环境下是很难实现的。
第14页:4K性能测试
4K性能测试
测试完相对常规的1080P和2K分辨率,接下来看看GTX 1070在4K分辨率下的表现,测试结果如下:
众所周知,4K分辨率对于硬件性能的要求极为苛刻,本次的GTX 1070虽然不能让游戏全程运行在60帧以上的环境中,但至少部分游戏的平均帧数已经突破了45帧,对于诸如《古墓丽影9》和《辐射4》这样的游戏来说,GTX 1070已经能够为玩家来带不错的4K游戏体验了。
第15页:VR性能测试
VR性能测试
在VR测试部分,我们选择了Steam平台推出的一款名为“SteamVR Performance Test”的软件程序,该程序可以全面检测用户的PC性能,考验PC是否能够支持VR设备稳定流畅运行。SteamVR效能测试会透过一段2分钟由Valve制作的《光圈科技机械人维修VR展示》来评估玩家电脑的渲染力。在收集相关数据后,它将判断玩家所使用的系统能否维持在90fps的帧率运作以及VR内容的视觉保真能否够校调至建议的水平标准。
《SteamVR Performance Test》
GTX 1070保真度在VR测试中,GTX 1070的保真度达到了与GTX 1080相同的程度,并且测试曲线非常稳定,全程维持在保真度非常高的状态下,这就说明GTX 1070能够完美完成VR任务,并且在执行效率上相比GTX Titan X要更高。
第16页:显卡功耗及温度测试
显卡功耗及温度测试对于游戏显卡来说,功耗和温度仍旧是我们参考的必要数据,因为这些数据听起来好像是和性价比没什么关心,但它作为辅助属性密切影响玩家的实际游戏体验,更高的功耗会带来更多噪音和温度,因此我们应该全角度评价产品,而不是仅仅通过性能和价格。
温度方面我们将继续采用Furmark来进行测试,考虑到不同游戏之中,显卡的负载率不同,尤其是低分辨率和高分辨率的负载率差异会让显卡的功耗完全无法测算平均数值。因此我们需要采用Furmark这样的权威性烤机软件,让GPU芯片之中每一个运算单元完全满载,充分发挥供电最大化的状态才能得出准确的成绩。
显卡烤机温度为79℃
功耗方面我们则是采用Furmark拷机,让显卡达到满载状态,然后拍摄功耗仪实时功耗。我们将参数设定为1280*1024分辨率,开启8*MSAA,最终GTX 1070以最高满载温度79℃的情况下完成测试,频率稳定在1.7GHz左右。在温度较低时,在GPU boost 3.0的作用下,显卡频率一度飙升至1800MHz,当温度上升到温度墙79℃是,显卡稳定在官方所述的boost频率上。散热器在满载时,转速也稳定在50%,也就是2000转左右,在这个转速下的噪音还是可以接受的。
整机功率对比(不含显示器)
得益于Pascal架构的高能耗比,GTX 1070的整机待机功率仅为60W左右,与GTX 1080功率接近。当GTX 1070满载状态运行时,整机功率提升至220W左右,相比GTX 1080低了近50W,符合GTX 1070的150W TDP设定。
第17页:Maxwell最佳接班人诞生
在经历了漫长的等待之后,万众期待的GTX 1070终于得以露出真容。经过上面一系列的测试,GTX 1070为我们带来了不小的惊喜。与上一代同级别产品GTX 970相比,GTX 1070得到了50%以上的性能提升,然而价格仅提升了千元左右,这在目前发展缓慢硬件市场中是极其难得的。
性能强劲的GTX 1070
更令玩家们兴奋的是,GTX 1070虽然仅为Pascal架构的次旗舰产品,但性能却完全超越了GTX 980 Ti,甚至可以与上代旗舰GTX Titan X一决高下。并且,得益于全新的16nm工艺,GTX 1070的功耗再次下降,这就为非公版产品创造了更多的提升空间。从我们上面的测试来看,公版GTX 1070的很多测试项目得分与GTX Titan X十分接近,相信只要稍微提升一下频率,非公版GTX 1070超越GTX Titan X是一件非常轻松的事情。
显卡TDP仅为150W
NVIDIA联合创始人兼CEO 黄仁勋毫不夸张的说,GeForce GTX 1070的出现,给与了Maxwell架构显卡沉重的一击,这不仅是为了加速Maxwell的停产,更是为了迎接竞争对手的挑战而做出的万全准备。另一方面,对于大部分玩家来说,与其花5000多元购买一款GTX 1080,不如花3000多元购买能够提供GTX 1080 70%性能和全部新技术的GTX 1070更加实惠。总的来说,GTX 1070不仅将显卡的性价比发挥到的极致,更是Maxwell的最佳接班人。从规格、功耗等多方面因素来看,未来的非公版GTX 1070还会带来更多的惊喜,让我们拭目以待。