GeForce GTX 1080首发评测 缔造性能神话(2)
今年被很多人认为是VR元年,酝酿了多年的VR终于呈现出井喷式增长;今年同样是GPU的爆发之年,时隔5年,28nm的GPU终于退出历史舞台,全新的14/16nm制程开始大放光彩。随着NVIDIAPascal架构和AMDPolaris显卡的大幅。...
似是故人的新架构
GeForceGTX1080采用了两年前就已在GTC上被老黄透漏的全新架构――Pascal,“Pascal”依然取自一位著名物理学家的名字,国际单位制中压力的单位“Pa”即以其姓氏命名。Pascal架构的第一款产品是4月初发布的TeslaP100,其采用GP100大核心,而这次发布的GTX1080则是采用GP104核心,具体型号为GP104-400,次旗舰GTX1070为GP104-200。GP104核心面积约为314平方毫米,得益于16nm的制程优势,核心内集成了72亿晶体管,是GTX980晶体管数量的1.38倍,核心面积却仅为GTX980的78.9%。
NVIDIAGP104-400核心
基于Pascal架构的GM204-400芯片运算资源总量为2560个ALU,TFU数量为160个,后端的ROPs数量为64个,四个带宽为64bit的双通道显存控制器组成了总量为256bit的显存控制单元,大小为8GB。同GTX980相比,其各项参数均有所提升,尤其是显存带宽达到了320GB/s,这是因为其率先采用了GDDR5X显存,GDDR5X显存的改进使得GTX1080在位宽相同的情况下拥有更高的带宽,初期即可达到10-12Gbps,而随着进一步的研发最高能够提升到16Gbps。
显卡规格比较表 | ||||
显卡型号 | GTX1080 | R9FuryX |
GTX980 |
GTXTitanX |
首发限价 | /$599 | /$649 | /$549 | /$999 |
GPU代号 | GP104 | FijiXT | GM204 | GM200 |
GPU工艺 | 16nm | 28nm | 28nm | 28nm |
GPU晶体管 | 7.2B | 8.9B | 5.2B | 8B |
着色器数量 | 2560 | 4096 | 2048 | 3072 |
单精度浮点 | 9T | 8.6T | 5T | 7T |
ROPs数量 | 64 | 64 | 64 | 96 |
纹理单元数量 | 160 | 256 | 128 | 192 |
核心频率 | 1607MHz | 1050MHz | 1126MHz | 1000MHz |
boost频率 | 1733MHz | 1050MHz | 1216MHz | 1075MHz |
架构 | Pascal | GCN | Maxwell | Maxwell |
显存频率 | 2500MHz | 500MHz | 1753MHz | 1753MHz |
内存位宽 | 256bit | 4096bit | 256bit | 384bit |
内存带宽 | 320GB/s | 512GB/s | 224GB/s | 336GB/s |
内存类型 | GDDR5X | HBM | GDDR5 | GDDR5 |
内存容量 | 8GB | 4GB | 4GB | 12GB |
注:表中售价均为官方首发限价
我们可以看到GeForceGTX1080的默认核心频率达到了惊人的1607MHz,Boost频率为1733MHz,显存带宽为320GB/s,这款产品完整支持DirectX12API以及异步运算,在DX12中有着更好的表现。GTX1080的默认PixelFillrate能力达到了102.8Gpiexls/S,默认TextureFillrate能力为277.3Gtexels/S。凭借超高的基础频率和庞大的运算规模,GTX1080拥有9TFLOPS的超高单精度浮点运算能力,照比GTXTitanX提升了28%,甚至超越了R9FuryX的8.6TFLOPS单精度浮点运算能力,成为目前单精度浮点运算性能最高的游戏显卡。
GP104架构图
Pascal架构GP104-400芯片由以下主要的部分组成:
1、基于TSMC的16nmFinFET工艺。
2、4单元的宏观并行结构,20组SMs单元被分为4个GPC,每个GPC包含5组SMs。
3、20组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PolyMorphEngine,同时均下辖5组更基本的SM单元,每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的TextureArray,四组并行的二级线程管理机制以及对应的shared+UnifiedCache等缓冲体系。
4、GP104拥有8个32位显存控制器,总计256位,每个32位显存控制器包含8个ROPs单元和256KB二级缓存,共计64个ROPs单元和2M二级缓存。
5、改进型的4.0版本PolyMorphEngine,包含了为VR设计的TheSimultaneousMulti-ProjectionEngine,在极端情况下,SMP引擎可以减少32倍VR所需的几何渲染工作量。
GP104SM单元架构图
在GeForceGTX1080上,我们看到了其与上代基于Maxwell2.0架构显卡相类似的设计,主要区别就是每个GPC中多了一组SMs单元。这就让这款显卡能够支持所有在GeForceGTX900系列中的特性,以后使用到这款显卡的玩家能够获得与其他采用基于Maxwell2.0架构设计的显卡的体验。