![]() |
|
|
|
2007年10月11日 14时21分
本文作者:陈寅初 点阅人次:
“Rivatuner的作者Unwinder最近也发布了2.05版的Rivatuner,允许玩家在Windows Vista或者Windows XP下自己独立地设定shader、rop频率,让玩家体验更多的超频乐趣。”
轻轻松松玩转G8x Shader超频 从DirectX 9开始GPU引入可编程着色器(programable shader),这些shader可以对顶点、像素等对象的属性进行复杂的计算,达到千变万化的画面效果,而传统GPU上曾经扮演重要角色的固定功能单元——例如纹理映射单元(TMU)、光栅操作处理器(ROP)重要性正逐渐削弱。 基于这一趋势,NVIDIA在第二代DirectX 9 GPU——NV4x上开始让shader的资源达到两倍于TMU、ROP的数量,ATI也在RADEON X1900/1600系列开始让shader的数量达到TMU/ROP的三倍。 有趣的是NVIDIA在GeForce 7系列上引入了异步几何单元时钟技术,让vertex shader的速度比pixel shader高出几十个MHZ,一定程度上达到了提高vertex shader处理的速度。 在2004年2月ATI宣布和美国德州的Intrinsity合作,获取后者的Fast14电路设计技术授权,该技术能让GPU逻辑电路的时钟达到4倍的速率,以当时来看可以做到1.6GHz到2.4GHz。 不过在ATI采用上Fast14之前就与AMD合并,而获取Fast14技术3年后推出的R600家族产品并未使用上改技术,GPU内的各个关键逻辑单元仍然保持同步的速率(shader、TMU、BE都运作于同一个频率上)。 而ATI的竞争对手——NVIDIA虽然没有获取Fast14技术,但是在06年年底推出的G80却引入了1.35GHz shader、575MHz ROP的异步时钟技术,成为首枚shader时钟超过1GHz的GPU产品。 不仅G80具备shader/ROP异步时钟技术,事实上整个G8x家族都具备该特性,成为G8X系列的一个重要技术亮点。 shader之所以能够跑上1.X+GHz等级,关键在于其运算特性决定的。和TMU需要频繁访问显卡内存不同的是,现在的shader运算非常依赖于片载cache,这和CPU设计非常类似。为此G8x的设计师为G8x的每个SM(streaming multi-processor)选择了小而简单的cache(以PDC为例,时延可以达到极快的1个周期),从而让高频的shader设计成为可能。
从Forceware 163.44驱动开始,SHADER/ROP的固定比率被"松绑"了。例如G80的SHADER:ROP为1.35GHz:0.575GHz=2.35倍,这个比率在以往除了在BIOS文件中修改或者购买华硕品牌的G8x显卡(ASUS Smartdoctor允许独立调整shader频率)外别无他法。 换句话说从Forceware 163.44驱动起,NVIDIA为更多超频玩家提供了更灵活的玩法,驱动内部提供了参数允许在最低2倍比率的基础上作自由的设定,例如2.1、2.2、2.3、2.4倍等等,这取决于产品的个体体质和散热、供电条件。有见及此,Rivatuner的作者Unwinder最近也发布了2.05版的Rivatuner,允许玩家在Windows Vista或者Windows XP下自己独立地设定shader、rop频率,让玩家体验更多的超频乐趣。 如何使用Rivatuner 2.05进行独立shader超频 实现免刷BIOS独立shader超频的三个前提: 1、拥有一片GeForce 8系列的显卡。 2、安装NVIDIA Forceware 163.44版或者更高版本的驱动程序; 3、安装Rivatuner 2.05。 在安装好驱动和Rivatuner后,我们执行Rivatuner:
如果你正在使用的是Windows Vista,那么可以直接进入超频,不过如果是Windows XP,这需要到Power USER的标签下作如下的设定:
接下来你就可以点选主界面(main)中Driver setting中的那个小三角按钮的第一个图标作超频了。
对于GeForce 8系列卡,这里会有三个时钟超频选项,分别是Core Clock、Shader Clock以及Memory Clock。在Core Clock和Shader Clock之间有一个名为link cloks的选项,默认情况下是打勾的,这时以显示卡默认的shader:core比率来调整频率。 如果去除该选项后,玩家就可以独立地设定shader clock。 注意:有时候单独调整shader频率未必会马上起效,此时可能需要略为动一下Core Clock的频率,例如+5MHz。 实战2GHz shader clock 可能是因为驱动或者硬件本身的限制,目前我们只能实现最低2:1的shader:ROP频率比率,我们以嘉威的影驰GeForce 8600GTS骨灰版魔魂进行了一次实验。 这片卡本身就是一片GeForce 8600GTS的超频版本,默认的规格是内核频率:720MHz|shader频率:1566MHz|内存速率:2200MT/s,即shader:ROP比率为2.175。 这款产品拥有Coolermaster的龙骨热管散热器,卡上有256MB标记为0.8ns的GDDR3内存,具备了较佳的超频潜力。 按照嘉威的说法,GeForce 8600GTS在设定电压为1.55伏特(默认1.45伏特)后,内核(ROP/TMU等电路)能达到1GHz,shader频率此时更加是达到2GHz以上的级别。 我们收到的这片影驰GeForce 8600GTS骨灰版魔魂本身已经由Galaxy的工程师特别修改过部分电阻,GPU内核默认电压为1.55伏特(市售的版本仍然为1.45伏特),嘉威的工作人员特别叮嘱,这只是为了一探8600GTS的超频上限,并非鼓励大家进行焊接修改。 我们手头拿到了由他们提供的修改资料,现在公布如下:
这里的R663原本是作为显示卡过载保护电路的电阻,这颗电阻对于显卡没有过大的影响,而在最新出货的影驰GeForce 8600GTS中已经直接取消掉这个电阻。需要注意的是,影驰GeForce 8600GTS的PCB设计是自己开发的,特别是供电电路布局上和NVIDIA的参考版有明显的差别,因此上面的修改只是适用于影驰GeForce 8600GTS上。 在这片修改为1.55伏特内核电压的影驰GeForce 8600GTS骨灰版魔魂上,我们发现在linkclock模式下(shader:core按照BIOS设定的比率)920MHz Core Clock下能达到完全稳定运行。 在高于920MHz Core clock后,3DMARK06的batch test会提示D3D9设备错误,但是ATITOOL的瑕疵扫描完全正确,3DMARK06性能评分部分的测试可以正常完成;而在Core Clock高于950MHz~1GHz的情况下,ATITOOL的瑕疵扫描运行一段时间后会提示报错,不过3DMARK06的性能评分测试部分也依然能完成。 最后我们以920MHz作为内核的超频上限,以此为基础单独调整shader频率。前面提到,影驰GeForce 8600GTS骨灰版魔魂默认的shader:ROP比率为2.175,不过因为时钟步进并非相等,因此当Core Clock为920MHz的时候,实际的shader clock并非920*2.175=2001MHz。 根据Rivatuner的监测,在Core Clock设置为920MHz的时候,实际监测到的Core为918MHz,shader clock实际是1944MHz,shader:ROP为2.1176。 我们到Rivertuner的超频页面内把linkclock前面的小钩去掉,单独设置shader clock为2000MHz,"应用"后跑到游戏中,可以看到此时的shader为1998MHz,Core clock仍然维持在918MHz。
超频前后的性能对比:
在内核频率超频了大约30%的情况下,性能普遍比超频前提高了16%的水平,考虑到影驰GeForce 8600GTS骨灰版魔魂默认的规格已经是比公版更快,可以看出GeForce 8600GTS的最大潜力应该在20%左右水平,不过这需要在内核电压提升0.1伏特左右情况下才可能发挥出来,此外我们还注意到加压超频后对电源的要求也有所提高,因此不仅散热方面需要注意,电源也是不可忽视的因素。 G8x独特的异频设定方式不仅为玩家提供了更多的超频乐趣,而且能加强对shader运算需求日益增加趋势的适应,例如G84的shader:tmu比率大致为(32*1D):16或者(8*4D):16,经过shader异频设定(标准版8600GTS的shader:rop为1.45GHz:0.675GHz,比率为2.15)后,就变成了(69*1D):16或者(17*4D):16,需要注意的是G8x的shader是标量设计,效率本身就比采用5路超标量的R6xx家族更高。 与「轻轻松松玩转G8x Shader超频」相关的本站内容连接
|
| |
|
| |