自nVIDIA于GeForce 256提出GPU这个概念以来,显示核心就作为一个单独的单元从传统处理器中分离开来,主要负责视觉方面的处理工作。而发展至今日,GPU的性能已经远比当初强大,昔日停留在“视频卡”的概念也逐渐改变,GPU负责的事情已经超越原本单纯的2D/3D处理,它更多以协处理器的形式服务于制图工作者以及科研人员。未来的计算机时代将是视觉处理技术的时代,业界的领军者曾经指出。
工作负荷迅速从CPU向GPU(图形处理器)的转移不断鼓舞着消费类应用程序的开发。在NVISION 2008大会上,全球视觉计算技术的行业领袖NVIDIA(英伟达)公司向世人展现了新GPU时代的四大技术:使GPU担负更多应用工作的CUDA、进一步从游戏中解放CPU的游戏PhysX加速、为游戏用户提供亲历其境体验的3D Stereo、为发烧游戏用户提供更极致体验的SLi技术。nVIDIA将这四项技术统称为GeForce四大内功(Force WithIn)。
nVIDIA倡导的GeForce 四大内功中的CUDA在之前的一段时间内网友一直苦于无法找到支持这项技术的软件,但是在nVIDIA的不断倡导和推广中目前已经有越来越多的软件开始支持CUDA技术,运用GPU加速视频处理与单纯通过CPU进行视频处理到底存在多大的优势呢?为了更能接近用户的真实情况,我们选择了目前价位比较接近主流用户同时以高性价比著称的盈通游戏高手系列显卡中拥有非常高人气的盈通9800GT游戏高手红牛版作为测试,并且将它与对手的HD4830进行对比评测。
2显卡GPU加速实际应用
并行处理架构:GPU将比CPU更主要
GeForce 系列的GPU同样是一款非常出色处理器并行架构处理器,而NVIDIA提出的CPU+GPU的异构运算平台在目前众多领域有着非常大的优势。随着越来越多的应用程序对GPU并行运算的支持,相信未来GPU重要性超过CPU也并非天方夜谭。
NVIDIA方面,上代G8X图形核心就采用了先进的统一渲染架构,拥有多达128个流处理器,引入几何着色器功能……这一切简直就是专为GPGPU运算而生!为了最大程度的发挥几何着色器的威力,G80还专门设置了一个名为流输出层(Stream Output State)的部件来配合它使用。这个层的功能是将Vertex Shader和Pixel Shader处理完成的数据输出给用户,由用户进行处理后再反馈给流水线继续处理。它可以直接读写本地显存。我们可以通过Stream Out把GPU拆成两段,只利用前面的一段几何运算单元。对某些科学研究,也可以通过stream out来利用GPU的数学运算能力,等于在CPU之外又平白多得了一个数学协处理器。我们可以这样理解G80图形核心的几何着色器和Stream Out单元:GS提供了改变图形数量的能力,Stream out提供了硬件Multi-pass的支持。可以预见,今后围绕这些全新的功能,又会有一批新的GPU通用计算程序出台。
面向未来:CUDA应用方向
随着显卡的发展,GPU越来越强大,第一代统一渲染架构的GTX 280核心中就已经拥有240个单独的ALU,因此非常适合并行计算,而且浮点处理能力也远远优于目前的多核CPU,加上GPU为显示图像做了优化。在众多计算领域上已经超越了通用的CPU。如此强大的芯片如果只是作为显卡就太浪费了,因此NVidia推出CUDA,让显卡可以用于图像计算以外的目的。CUDA(Compute Unified Device Architecture)工具包是一种针对支持CUDA功能的GPU(图形处理器)的C语言开发环境,未来还将发布Fortran语言版本。
CUDA(Compute Unified Device Architecture)是一个新的基础架构,这个架构可以使用GPU来解决商业、工业以及科学方面的复杂计算问题。跟以往的GPGPU概念不同的是,CUDA是一个完整的解决方案,包含了API、C编译器等,能够利用显卡核心的片内L1 Cache共享数据,使数据不必经过内存-显存的反复传输,shader之间甚至可以互相通信。对数据的存储也不再约束于以往GPGPU的纹理方式,存取更加灵活,可以充分利用stream out特性。以上几点都将大大提高GPGPU应用的效率。例如,在游戏中我们可以使用CUDA来让GPU承担整个物理计算,而玩家将会获得另他们感到惊奇的性能和视觉效果。另外,用于产品开发和巨量数据分析的商业软件也可以通过它来使用一台工作站或者服务器完成以前需要大规模的计算系统才能完成的工作。这一技术突破使得客户可以任何地方进行实时分析与决策。同时,一些以前需要很先进的计算技术来达到的强大计算能力的科学应用程序,也不再受限在计算密度上;使用CUDA的计算可以在现有的空间里为平台提供更强大的计算性能。CUDA采用C语言作为编程语言提供大量的高性能计算指令开发能力,使开发者能够在GPU的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。
CUDA工具包推出已有1年,它的推出马上受到了众多软件/游戏开发商以及科研机构和程序爱好者的欢迎,NVIDIA方面也将发布最新的CUDA 2.0版本。相信在未来,CUDA将会受到越来越多的领域的支持。目前,支持CUDA环境的GPU主要有采用统一渲染架构的显示核心。
3测试平台方法及BadaBoom测试成绩
测试平台及测试方法简介
评测平台 CPU Intel Core 2 QX9770(OC 3.6G、6MB*2 L3 Cache) 主板 技嘉 X48-DQ6(X48+ICH9R) 内存 宇瞻 DDR2-800 1GB x 2(5-5-5-15) 硬盘 希捷 7200.10 SATA 500G 显卡 HD4830(575/1800MHz)
盈通9800GT(650/2000Mhz)
软件平台 系统软件
Windows VISTA Ultimate SP1
驱动程序
AMD Catalyst 9.4 For Vista
NVIDIA显卡:ForceWare 185.68 For Vista
评测软件
System:
3DMark Vantage Ver:101 (DirectX 10)
Badaboom
vREVEAL
TOTALMEDIA
TMPGENC
蛋白质折叠
盈通9800GTCUDA应用:BadaBoom视频压缩
一直以来,视频编码的转化都是令用户非常头疼的一件事,一款顶级的处理器在转换容量巨人的视频文件的时候,慢如蜗牛的速度令人难以忍受,这也主要受目前CPU性能的制约。目前,NVIDIA与许多软件开发商在推广支持GPU加速的视频压缩软件,Badaboom就是一款支持GPU加速的视频转换软件,可以把mpeg2的视频转换为ipod或者iphone这样的所使用的H.264视频格式,据称速度方面是目前CPU转化的10倍以上,为了验证其真实性,我们就做了一次相关的评测。
在Badaboom视频转换中我们选择了一段时间为1分钟大小为470MB的高清视频进行转换,在转换中我们将软件特效设置成最高,记录在使用N卡进行GPU加速下所使用的转换时间。
Badaboom是一款支持GPU加速的软件,并且目前它只支持nVIDIA显卡,使用AMD显卡的用户暂时无缘这款软件了,因此我们看到在测试中盈通9800GT红牛版在转换470MB视频时只用了35秒,由于Badaboom不支持A卡我们无法取得HD4830的测试成绩。
4vReveal视频优化测试
vReveal视频优化测试
vReveal软件能将一些模糊的视频和图片通过去噪和通过差值计算让画面更加清晰锐利。
在vReveal软件测试中我们通过对同样一段视频进行处理以反映出在盈通9800GT游戏高手红牛版在使用GPU加速时的CPU占用率和不能使用GPU加速的HD4830进行对比,通过上面的测试成绩我们看到盈通9800GT游戏高手红牛版在进行视频优化时的CPU占用率为30%,而HD4830的CPU使用率则高达85%。
5TMPGEnc视频转换软件测试
TMPGEnc视频转换软件测试
TMPGEnc软件是一款来自日本Pegasys公司的视频软件,这款软件以超高的压缩质量及画质而闻名,并且目前很多的视频编辑都在使用这个软件。
从上面的图片中我们看到在选项中我们可以打开这款软件的具体设置界面,我们在使用盈通9800GT游戏高手红牛版时候可以将NVIDIA CUDA选项打开进行GPU加速,而在使用A卡时是无非打开这个选项的。
从上面的测试结果中我们看到具备GPU加速的盈通9800GT游戏高手红牛版在测试中占有明显的优势,在进行1分钟高清视频转换时候盈通9800GT游戏高手红牛版用时74秒,CPU占用率为35%,而HD4830用时180秒,CPU占用率达到了71%。
6TotalMedia软件测试
TotalMedia软件测试
TotalMedia软件同样是一款性能非常强悍的视频处理软件,它能将一些老式的DVD影片和画质并不高的视频进行处理使其画质更高。经过TotalMedia软件处理的视频质量甚至比一些低规格的高清影片还要好。
在TotalMedia软件的测试中我们看到具备GPU加速的盈通9800GT游戏高手红牛版在视频转换中的CPU占用率仅为6%,而HD4830在视频转换中的CPU占用率则达到了11%。
7威力导演视频编辑软件
威力导演视频编辑软件
威力导演这款软件就是专门针对这样的人群而设计的一款简便易上手的视频剪辑软件。软件的界面非常具有前卫感,提供的功能包括了视频剪辑、音频分离、音频剪辑、过场效果、视频特效、字幕效果等等等等,可谓非常全面。即使是对于有一定专业要求的用户来说,威力导演也能够满足他们的需要。
介绍完软件下面我们再来看看这款软件的一些具体的设置。
在威力导演的设置界面我们看到有一个GPU加速选项,在使用N卡时我们可以将前面的对勾选上,而在使用A卡时该选项默认为灰色不可选择。
在使用威力导演进行视频输出时我们看到使用盈通9800GT游戏高手红牛版打开GPU加速与使用HD4830进行视频输出存在着非常大的差距,我们在输出一段1分钟的高清视频时盈通9800GT游戏高手红牛版使用的时间是187秒,而HD4830则需要225秒才能全部完成视频输出。
8Folding@home测试成绩
Folding@home测试成绩
是斯坦福大学的一个分布式计算计划可以利用分布于全球的计算机模拟复杂的蛋白质折叠效应,是一款典型的科学计算程序,目前已经推出了支持CUDA环境的版本。该项目的客户端程序可以使用客户机的CPU或NVIDIA CUDA enable GPU或者AMD Radeon对同一以项目进行求解。
是一款既支持NVidia GPU加速的软件,并且它同时也支持AMD Stream,从上面的测试成绩中我们看到在使用盈通9800GT游戏高手红牛版进行测试时的成绩为59.86iter/sec,使用HD4830的测试成绩则为44.66iter/sec,相比之下盈通9800GT游戏高手红牛版更具优势。
9PConline评测室总结
PConline评测室总结
从上面的测试结果中我们看到目前虽然AMD具有Stream技术,但是市面上支持的软件却比较少,而目前一些主流视频转换和编辑软件无一例外都只支持NV的GPU加速,部分软件设置只能在N卡下才能运行。目前中端主流价位显卡一直是网友和厂商都非常关注的区域,在游戏性能上固然能反映出一块显卡的性能优劣,但是通过应用软件来显示出显卡GPU加速的成绩则更能体现一款显卡的整体使用性。通过对盈通9800GT游戏高手红牛版在视频软件中的测试我们看到在与对手的HD4830比较下,盈通9800GT游戏高手红牛版在主流视频编辑软件中运行GPU加速使得CPU占用率和视频转换和输出时间都得到了大幅的降低。