统一架构设计是DX10的最重大改进之一,传统一架构的关键就是它整合了功能类似的VS和PS运算单元,另外还加入了几何shader单元,也就是将VS、PS、GS单元进行了整合,每个流处理单元都可以进行VS、PS、GS的运算,而根据游戏的负载调整每个单元的工作内容。全新的R6xx会计算游戏画面的Shader数据类型,从而灵活的调配Shader单元进行不同的数据类型运算,达成资源的合理利用,有效的提高GPU的运算效率。
『HD 2000系列的高、中、低端显卡全面都采用统一架构设计』
◆核心架构:沿用R600的统一架构
随着shader运算的增加,老的产品架构设计已经不能满足需要了,统一架构的关键就是它整合了功能类似的VS和PS运算单元,另外还加入了几何shader单元,也就是将VS、PS、GS单元进行了整合,每个流处理单元都可以进行VS、PS、GS的运算,而根据游戏的负载调整每个单元的工作内容。通过一个专门执行单元的运算,全新的R6xx会计算游戏画面的Shader数据类型,从而灵活的调配Shader单元进行不同的数据类型运算,达成资源的合理利用,有效的提高GPU的运算效率。
R600的核心架构主要分为指令处理器、装备引擎、超线程分派处理器、流计算单元、纹理单元和缓存、内存读取/写入缓存和流输出缓冲、着色输出、渲染器后端几大部分,在RV670中同样如此,可以说,在核心架构上RV670完全继承了R600的架构体系,唯一区别在于RV670将显存位宽缩减到256bit。指令处理器和装备引擎没有什么好谈的,它们主要负责指令的发送和初级信息的收集汇编,此后便是统一架构第一个重要的处理过程,那就是超线程分派处理器。前面的介绍我们已经知道,统一架构的最大特点就是VS、PS、GS单元的统一。
◆RV670核心架构解析:
『R600核心逻辑架构图』
从上面的架构图上来看,此次RV670的核心架构与R600完全相同,依然保留了320个流处理单元,并且搭配16个纹理渲染单元以及16个渲染器后端,同时还拥有可编程的向前器单元。另外在对现存的优化上,内存控制器能够更高效率的利用显存带宽。RV670与R600产品不同之处在于,RV670将显存的位宽缩减为了256bit,外加512bit环状总线;而R600则是512bit显存位宽加512bit环状总线。不过在性能表现上,根据ATI的信息则显示RV670虽然外部总线缩减到了256bit,但是由于保留了512bit的环状总线,因此性能表现上则与Radeon HD 2900相当。