商讯信箱
用户名: @
密  码:   注册|忘记密码
登录
个人用户经销商
信箱 E杂志
您的位置:首页 > diy硬件 > 正文       

    在NVIDIA 7900显卡即G71推出后,NVIDIA与ATI核心架构差异就变得非常明显了。大家最为熟悉的可能是在NVIDIA显卡上除了传统的核心频率和显存频率外,多了一个Shader频率。而且它将非常明显影响到显卡的性能。我们也在8800GTS 320M推出时做过Shader频率超频测试,当Shader频率从默认1200MHz提高到1600MHz时,性能已经赶超8800GTX了。但是,ATI的产品并不存在这样一个Shader频率,或者说它的Shader和核心外部的工作频率是一致的。

    再结合我们前文介绍产品规格时谈到的流处理单元的数量,ATI R600的320个与G80的128个或96个,差距如此巨大到底是什么原因?

    所谓320个流处理单元,即320个标量处理单元。上图中央大量的每5个为一组的黄色方块示意的则是这320个标量处理单元即320个Scalar。按照R600的规格,它具有64条流处理渲染管线,每条管弦中是一个5路的Superscalar 处理器,这5个单元都每时钟周期都可以用作Componments也可以用作instructions。从另一个角度来看,每5个单元仍被认为是一个矢量运算单元(Vector ALU)。而值得注意的是,NVIDIA在G80上采用的称之为超标量运算单元。

    在我们常见的对每个像素的渲染中,无论是PS的RGBA四个通道(A:alpha通道)的渲染还是Vertex XYZW四个轴位置改变的渲染,大多为4个通道并行处理即4D 矢量操作。当然,并不是说所有的渲染都是4D渲染,在渲染中肯定存在1D、2D、3D的操作。那么,此时矢量处理单元必然存在浪费。而NVIDIA采用超标量(完全标量)化的运算单元处理,将所有多维度运算均看作多个一维运算,完全避免了上面谈到的浪费。

    当然,NVIDIA的G80由于只有128个或96个处理单元,所以NVIDIA给他们更高的运行频率,因为NVIDIA认为在今后的GPU应用中处理部分要比ROP输出部分负担更重。ATI的设计其实也与此观点不谋而合,只不过实现的方式不同。简单的看,ATI的处理单元仍可能是矢量处理单元,但如果将每一组矢量单元看作独立的标量单元,那么数量众多达到了320个。运行频率与核心频率一致,相对NVIDIA来说处于较低水平。NVIDIA,完全标量化的处理单元数量虽少,但是NVIDIA让这部分运行频率提高,整体运算能力也随之提高。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
有问必答
©版权所有。未经许可,不得转载。
[责任编辑:赵宇为] [我要挑错]
相关产品
本文相关产品
   没有相关产品