PCINLIFE logos
 
前往业界动态栏目前往脑场特工栏目前往新品情报栏目前往IN评测栏目前往型人志栏目前往大家的PCINLIFE前往我的PCINLIFE
前往处理器及平台技术栏目前往图形卡及显示器栏目前往新手指南栏目前往存储设备栏目前往外设及附件栏目前往网络及互联技术栏目前往数码及家庭娱乐栏目前往展会及活动栏目
返回站点首页

前往处理器及平台技术栏目前往图形卡及显示器栏目首页前往新手指南栏目前往存储设备栏目前往外设及附件栏目前往网络及互联技术栏目前往数码及家庭娱乐栏目前往展会及活动栏目




   站点首页王牌评测频道图形卡及显示器RADEON HD 2900XT 512MB测试报告

2007年06月02日 21时24分  
本文作者:陈寅初  点阅人次:   
RADEON HD 2900XT 512MB测试报告
AMD与ATi合并后产生的第一强音Radeon HD 2900XT
“在经过数月的延迟后,这款代号R600的RADEON HD 2900XT终于正式发布了,面对这款架构全面革新的产品,PCINLIFE经过精心的策划完成了这篇测试报告,希望以深入浅出的方式为大家全面展现RADEON X2900 XT的实力。”
RADEON HD 2900XT体系结构——统一着色器

R600包含有4个SIMD单元矩阵,每个矩阵内有16个SIMD单元,每个SIMD单元内有四"瘦"一"胖"共计五个逻辑运算单元(ALU)以及一个分支执行单元。

16个SIMD单元同一时间内执行一个线程,各SIMD单元都有自己的寄存器供SIMD内的执行单元共享。

SIMD采用超标量+VLIW(甚长指令)设计。游戏的shader指令经过驱动的JIT(即时)编译器编译优化后,变成GPU能识别的机器码并被捆绑成长度数百位元的VLIW指令串包。

VLIW指令包到达指令序列器后,会被动态重新安排,序列器会把不相依的指令捆绑成能够尽可能让SIMD单元并行执行的指令串,交给SIMD单元执行。

最理想的状况下,每个SIMD单元能够执行5条算法指令,整个R600的峰值运算指令吞吐率可以达到每个周期320条或者说没每秒2400千亿条指令。

不过需要注意的是,天底下没有哪一个指令序列器、编译器是能在任何情况下确保100%的超标量执行能力,有些指令本身即使在采用了寄存器重命名等先进技术的处理器上,仍然会存在相依性的问题而无法实现超标量执行。

例如:

指令一:a=b+c
指令二:d=a*e

这两条指令中,第二条指令中的a必须等待第一条指令的运算结果,出现这样的情况时候,两条指令大多数情况下就不能实现超标量执行了。

相比之下,虽然G80跑的shader也肯定会出现相依性的指令,但是G80的SP都有自己完全独立的资源(开发人员编写shader程序的时候,只需要考虑单个SP的执行即可),SIMD指令在G80上都是串列地在SP执行,因此上面的两条指令在G80上执行,G80的运算资源依然可以达到100%的利用,而在R600上可能只有50%不到(ATI提供的资料是最糟糕的1D相依情况下是20%)的资源利用率。

因此,在为R600编写shader的时候,一定要必须尽量避免相依性的情况出现,只有这样才能让驱动程序的JIT编译器充分发挥VLIW优化策略。

点击这里到WE.pcinlife和大家一齐讨论本文章

上一页  1 2 3 4 [5] 6 7 8 9 10  下一页  下10页   
RADEON HD 2900XT 512MB测试报告文章的各章节:
  • 第1页 - ATI第六代图形处理器家族正式问世
  • 第2页 -  RADEON HD 2900XT体系结构概述
  • 第3页 -  RADEON HD 2900XT体系结构——前端
  • 第4页 -  RADEON HD 2900XT体系结构——超线程发送处理器
  • 第5页 -  RADEON HD 2900XT体系结构——统一着色器
  • 第6页 -  RADEON HD 2900XT体系结构——纹理处理单元
  • 第7页 -  RADEON HD 2900XT实物——盈通RADEON HD 2900XT 512MB
  • 第8页 -  RADEON HD 2900XT实物——蓝宝石RADEON HD 2900XT 512MB
  • 第9页 -  RADEON HD 2900XT实物——捷波RADEON HD 2900XT 512MB
  • 第10页 -  Windows XP/Windows Vista性能测试平台/CPU性能相依性测试
  • 第11页 -  Futuremark 3DMARK 06 1.10
  • 第12页 -  OpenGL游戏性能测试——Quake 4 1.30 1600/2048 4AA 16AF
  • 第13页 -  Far Cry 1.4 1600/2048 4AA/16AF/HDR
  • 第14页 -  Call of Juarez 1600/2048 1600/2048 HDR 4AA/16AF
  • 第15页 -  Half-Life 2: Lost Coast 1600/2048 4AA/16AF
  • 第16页 -  Ghost Recon Advanced Warfighter 1600/2048 16AF/EAA
  • 第17页 -  S.T.A.L.K.E.R:Shadow of Chernobyl 1600/2048 FDL 16AF
  • 第18页 -  Serious Sam 2 1600/2048 4AA/16AF HDR
  • 第19页 -  Battlefield 2142 1600/2048 4AA 16AF
  • 第20页 -  F.E.A.R 1600/2048 4AA/16AF;Soft Shadow
  • 第21页 -  Company of Heroes 1600/2048 4AA/16AF
  • 第22页 -  Call of Duty 2 1600/2048 4AA/16AF
  • 第23页 -  Need For Speed: Carbon 1600/2048 4AA/16AF
  • 第24页 -  The Elder Scrolls IV: Oblivion 1600/2048 4AA/16AF
  • 第25页 -  Infernal 1600/2048 4AA/16AF
  • 第26页 -  Rainbow Six: Vegas 1600 4AA/16AF HDR
  • 第27页 -  Splinter Cell Double Agent 1600 4AA/16AF
  • 第28页 -  D3D10——Call of Juarez DX10 1280/1600 HDR 4AA/16AF
  • 第29页 -  游戏截图对比——BF 2142、COD 2、COJ、COJ DX10 demo、DiRT
  • 第30页 -  游戏截图对比——Far Cry、FEAR、GRAW、Infernal、TDU
  • 第31页 -  游戏截图对比——NFS:Carbon、R6V、COH、COH DX10、STALKER
  • 第32页 -  交火、超频、耗电测试
  • 第33页 -  测试总结
  • 返回网页首部  

    与「RADEON HD 2900XT 512MB测试报告」相关的本站内容连接

    [内容标题]NVIDIA GeForce GTX 280测试报告
    [内容简介]
    GeForce GTX 280的推出,意味着GeForce 9800GX2的使命已经完结,因为后者在成本、耗电、性能上并没有什么优势可言,让位给GeForce GTX 280是理所当然的事情。
    [内容标题]嘉威影驰GeForce 8800GT 1GB SLI测试报告
    [内容简介]
    如果某个游戏的最高特效是以768MB为设计目标的话,512MB的G92、G94还是会因为内存容量问题出现性能骤降的现象。
    [内容标题]3DMark Vantage抢先体验
    [内容简介]
    3DMark由于使用简单、易于比较,作为一个测试工具在玩家当中还是相当流行
    [内容标题]难以掩饰的真相——25款游戏真实截图对比[更新]
    [内容简介]
    难以启齿的真相总是会被利益相关者以各种手段加以掩饰、扭曲,而一般的玩家往往缺乏专业的条件来判断其真伪,但是在互动的PCINLIFE上,我们得以有机会还原本来面目。
    [内容标题]NVIDIA GeForce 9800家族测试报告
    [内容简介]
    对NVIDIA来说,推出双芯单卡的原因主要在于单芯片无法满足当前玩家的需求,故此如果要推出双芯单卡,其前提必须是一款性能绝对最强的产品。

    返回网页首部  

      前往站点地图前往关于我们前往广告服务与报价前往建议与错误反馈  
      前往WE.pcinlife  前往ME.pcinlife      粤ICP备06054911号