ASUS ENGTX460 TOP - GPGPU i OpenCL performanse

CyberLink MediaShow Espresso
 
MediaShow Espresso je veoma jednostavan i odličan softver za pretvaranje video materijala u različite formate. Pored toga što podržava predefinisane profile za gotovo sve najpopularnije uređaje, servise i sl., isti je sposoban da iskoristi sve prednosti nove tehnologije, od višejezgarnih procesora, do CUDA-e, ali i ATI-jevih GPU-ova. Ovo ga čini izuzetno univerzalnim i odličnim za poređenje brzina grafičkih procesora u domenu GPGPU-a.
 
espresso.jpg
 
Program za prebacivanje i konverziju video fajlova na format pogodan za prikaz na mobilnim uređajima poput iPhonea, PSP-a ali i pripremu fajlova za You Tube. Postoji opcija čak i za direktan “upload” nakon završene konverzije. Posebna vrednost ovog programa leži u činjenici da su podržane najnovije tehnologije uključujući i GPU akceleraciju prilikom konverzije. Softver je dodatno optimizovan za simultanu konverziju više fajlova istovremeno (maksimalno 4) što će reći da je u potpunosti multi-thread orijentisan uz istovremenu podršku višejezgarnim i procesorima sa Hyper Threading Tehnologijom.
 
Vreme je izraženo u sekundama. Manja vrednost označava bolji rezultat.
 
espresso.png
 
Osim za igranje, moderne VGA kartice možemo iskoristiti i za ubrzanje specijalizovanih aplikacija koje poseduju GPU akceleraciju. Espresso je jedan od pionira na ovom polju ali nikako se ne može reći da je implementirao ovu funkciju do kraja, obzirom da angažuje tek 19% potencijala GPU procesora a CPU nikada ne silazi ispod 50% opterećenja. Ipak i to je dovoljno da vidimo koliko kartice pomažu prilikom konverzije video fajlova u You Tube format. Razlika je mala ali ipak uočljiva. Generalno, AMD Radeon procesori se bolje snalaze te je očekivano najsnažniji Radeon HD5850 bio najbrži. Nvidia GTX460 zaostaje čak i za slabijom Radeon HD5770 karticom ali je i minimalno brža od GTX 465 “teškaša”.
 

  
OpenCL performanse:
 
Za merenje OpenCL performansi grafičkih procesora koristili smo benchmarking alat koji meri sirovu snagu proračuna opšte namene. Ovaj test se bavi izračunavanjem kompleksnih algoritama ali i proračunima u klasičnom tipu aplikacija. Rezultati zavise od snage GPU procesora, arhitekture, memorijskog protoka, veličine keš memorije na GPU čipu, ukupne količine video memorije kao i sinhronizovanosti rada komponetni na samoj VGA kartici.
 
openCL.jpg
Veća vrednost označava bolji rezultat.
 
OpenCL int32:
 
OCL_int32.png

OpenCL Float Ops Multy:
 
OCL_floatOps.png
 
OpenCL Double Ops Multy:
 
OCL_doubleOps.png
 
OpenCL Matrix Trans. Double precision:
 
OCL_trans.png
 
Vidimo da u grupi OpenCL testova dolazi do izražaja različita arhitektura GeForce i Radeon grafičkih procesora. Zavisno od testa iskazuju se ogromne razlike ali se na kraju prednosti u različitim testovima kompenzuju. Naročito impresionira brzinska razlika u odnosu na klasične CPU čipove a to ukazuje na mogući pravac upotrebe pojedinih GPU akceleratora uz pomoć optimizacije na softverskom nivou aplikacija koje bi mogle na najbolji način da iskoriste njihovu sirovu snagu.