![]() |
|
|
|
2007年06月02日 21时24分
本文作者:陈寅初 点阅人次:
“在经过数月的延迟后,这款代号R600的RADEON HD 2900XT终于正式发布了,面对这款架构全面革新的产品,PCINLIFE经过精心的策划完成了这篇测试报告,希望以深入浅出的方式为大家全面展现RADEON X2900 XT的实力。”
RADEON HD 2900XT体系结构概述
ATI图形处理器体系架构回顾
和NVIDIA G80之前的图形芯片类似,ATI在桌面产品方面的发展也是经历了硬件三角形设置(Setup)引擎、集成硬件T&L、硬件VS/PS的阶段,其中最辉煌的当然就是我们时常提到的R300或者说第一代DX9产品的时代。 不过除了运算部分的变化外,ATI、NVIDIA的GPU在其他部分或者说纹理单元、光栅处理单元以及内存控制等方面也有相当巨大幅度的演进,例如各向异性纹理过滤、全屏抗锯齿、交叉/环路内存控制、高速缓存等等。 ATI在03年的时候获得了微软的XBOX 360研发合同,其中就包括了代号Xenos(又被称作C1)的图形处理器。最大的特色是采用了统一着色器单元架构,顶点、像素着色器程序都在同样的单元上执行,由线程调度器作动态的资源分配,还引入了顶点纹理拾取(VTF单元)等ATIS同期R5XX产品所不具备的特性。 Xenos还采用了主芯片+集成有10MB eDRAM的渲染后端芯片的双管芯单片封装设计,既满足了游戏机的低引脚数芯片设计,又很大程度上解决了带宽饥渴型应用的瓶颈问题,在成本、性能的取舍上获得了业界的好评。 和Xenos同期提供给微软选择的还有NVIDIA的NV50也就是G80的原始前身,不过NVIDIA认为在NV50上微软的授权方式不能接受,只同意NV4X或者G7X的技术授权,结果是微软选择了开价更好的Xenos。 R600家族的体系架构在一定程度上可以看作是延续自Xenos,但是和Xenos相比,R600不仅规模上大得多,而且在着色器单元等方面都有较大的改进,最重要的是R600是DX10代产品,而Xenos则只是DX9+。 代号R600采用了台积电的80纳米高速版(80HS),集成了大约7亿枚晶体管,一枚管芯内集成了3D处理、2D加速、视频加速、显示输出、内存控制、HDCP、5.1音频通道等单元。 第一款采用R600芯片的产品是这次发布的RADEON HD 2900XT,3D内核频率为750MHz,搭配512位内存总线,内存总线的传输速率为1.65GT/s。 R600具备4个Quad Processor(四方阵列处理器,简称QP),每个QP内包含了16个着色器(shader)处理单元,每个着色器内包含了5路超标量(superscalar)的运算单元(ALU)。 着色器内的这些运算单元的功能并不完全一样,其中的四个"瘦"单元均可以每个周期执行一条MAD(乘加)指令,而另一个"胖"单元除了可以每个周期执行一条MAD指令还可以每个周期执行一条诸如SIN、COS、LOG、EXP等相对更复杂的函数指令。所有的运算单元都是32-bit浮点精度,但是也可以执行整数指令。 R600的TMU(纹理映射单元)设计和C1类似,虽然都有32个纹理定址单元,但是只有16个纹理取样单元,因此纹理映射单元(TMU)实际上是相当于16个,不过它们的纹理过滤单元和以前ATI的桌面产品相比,实现了硬件浮点纹理过滤能力。 R600的渲染后端单元(ROP)为16个,具备双倍Z处理能力,共计每个周期实现32 Z处理,各ROP的渲染对象输出能力也比RX10000提高了一倍达到8 MRT。 简而言之,作为第一款上市的ATI DX10产品,RADEON HD 2900XT提供了480GFLOPS或者说240 BIPS、12 GPixel/s、12GTexel/s的峰值指标,但是单纯看这些数字是看不出这个架构的性能的,在它们背后的细节才是性能的真正关键所在。 与「RADEON HD 2900XT 512MB测试报告」相关的本站内容连接
|
| |
|
| |