而ATI始终认为大多数像素处理都是双线性过滤操作和从整数纹理中取样,而没有多少纹理查找过程,因此纹理操作的性能更多依赖于显存的容量与带宽,对硬件运算能力要求不高。相反,实际的渲染处理完全依赖于硬件能力,像素渲染的性能主要取决于像素流水线的数量,因此ATI就将像素渲染单元方面的加强作为技术改进的重点。
从R580核心开始,ATI就将像素处理单元和纹理单元的数量拉开到了3:1的比例,随着R600的推出,这个比例有进一步拉大的趋势,不过具体的比例现在也不好计算了,因为统一架构的采用,纹理单元中的寻址和拾取操作同样与Vertex Shader和Pixel Shader处理进行了分开。
『R600的纹理单元配合统一架构进行了很大的革新』
Radeon HD 2900内建4组纹理单元,每单元包含8个纹理寻址处理器(总数32个),执行着色指令,为纹理查找控制地址;每单元内建20个FP32纹理采样器(总数80个)每时钟周期可以取得1个单数据数值;每个单元内建4个FP32纹理过滤单元(总数16个)每时钟周期可以双线性过滤1个64-bit色彩数值,或者每2个时钟周期双线性过滤1个128-bit色彩数值。HD 2600和HD 2400 纹理单元有同样的功能。
Radeon HD 2000系列采用多层纹理缓存设计,大容量、共享式二级缓存存储一级缓存缺失的数据。其中,HD2900有256KB,HD2600有128KB,HD2400采用单层顶点/纹理缓存。所有的纹理单元能访问顶点缓存和一级纹理缓存,能为读取未过滤纹理提供更大的吞吐量。
Radeon HD 2000系列的全速浮点纹理过滤Full Speed Floating Point Texture Filtering,拥有全速64-bit HDR纹理双线性过滤(比Radeon X1000系列快大约7倍),半速128-bit浮点纹理过滤, 支持所有格式的三线性和各向异性过滤。Radeon X1000系列上的高质量模式,现在成为默认设置,针对问题纹理的处理方式进行改进。深度模板纹理(DST)采用百分比更近式过滤(PCF)使Radeon HD 2000系列拥有高性能的软阴影渲染。