此次推出的去年推出的55nm工艺G92核心显卡,就解决了这个问题,加入了对H.264编码格式的全程解码加速支持。下图很好的说明了G92核心中的VP2引擎对于H.264编码格式支持在这方面的进化过程。
『显卡视频加速功能的演化过程』
图中每个流程的四个方块,基本就是H.264解码的四个最主要步骤,也是资源消耗的主要四个部分,其中又以第一步的“CAVLC/CABAC解码”最为消耗运算资源,这方面远高于其他三步(简单的说,CAVLC/CABAC是H.264编码规范中两种不同的算法,都是为了提高压缩比,其中CABAC比CAVLC压缩率更高,但解码时自然也要求更高)。
如果像第一行那种情况,所有四个步骤全采用CPU纯软件解码运算,当碰上HDDVD版本的高码率H.264视频,CPU的负载会非常巨大,我们有专门的测试成绩供读者参考。
再到第二行的情况,在GeForce 7系列显卡上,虽然“CAVLC/CABAC解码”和“反向转换(Inverse Transformation)”仍然要CPU负责(这两步由BSP引擎完成),但显卡已经可以承担“运动补偿”和“解码去块”功能(由VP引擎实现),因此在整体性能上提升了不少,CPU的负载大幅度下降(可以参照这里的成绩)。但这还并不是最终的目的。首先,如果使用单核处理器(很多现有用户仍属于这种情况),依然无法很好的应付这类视频;其次,碰上编码率更高的视频,依然会给CPU造成很大的处理难度,导致视频播放的不确定性,可能消费者会遇到某些视频可以流畅播放,但是有些视频却丢帧的情况。
『G92采用的也是VP2引擎』
显然,显卡有必要像第三行那样:承担全部的H.264视频解码和处理过程,让其解码运算可以基本不依赖CPU!之前是G86/G84核心先实现了这一点,现在包括65nm和55nm的G92核心也都能做到了,购买9800GTX+显卡的用户无论配什么CPU,基本上都完全不用担心系统回放不流畅H.264视频了。
当然,对于VC-1编码视频,G92核心和其他GeForce 8系列显卡一样,仍是部分过程加速,原因也早就分析过,VC-1编码视频解码难度相对小不少,因此NVIDIA判断有这种程度的加速能力已经足以应付了。