GeForce 8800GT срещу Radeon HD3800

by PC Mania | Archive | 0 Comments | 09 дек. 2007

Следвайки редовния си график за пускане на нови модели видеоускорителни чипове, през есента на 2007-ма nVidia обявиха поредната модификация на успешната серия GeForce8. Малко след това и наваксвайки огромното забавяне на предшественика си, беше обявен и новият Radeon HD на ATI/AMD.

GeForce 8800GT (G92)

G92 представлява обновен вариант на G80 (досегашните GF8800 GTS/GTX/Ultra), произведен чрез 65nm технология вместо 90nm. Това води до значително по-малко консумирана енергия (105W) и съответно охладителят на новите GF8800GT платки е компактен и не заема пространството над съседния PCI/e слот. Вентилаторът също е по-тих от очакваното (дори при натоварване не се качва над 45dB). Платката се захранва чрез един допълнителен 6-изводен PCIe куплунг и има един SLI конектор за двуплаткова работа. В цялата GF8 фамилия единствено GF8800GTX/Ultra имат по два за верижно свързване на повече от две платки, a GF8800GTS/GT/8600 имат само един – за двуплаткова работа (най-вероятно Tripple/QuadSLI също ще се поддържа след няколко ревизии на драйверите, но само с комуникация през PCIe x16 интерфейса).

Освен чисто технологичните подобрения G92 въвежда и някои други неща, които досега бяха чужди за GF8800 платките. Новият чип има всички подобрения, въведени в продуктите от нисък и среден клас (GF8600/8500/8400). Добавен е VP2 PureVideo HD хардуерен модул за декомпресия на MPEG2/4 видео съдържание. Разликата между VP1 (GF7 и G80 базираните GF8800) и VP2 е в това, че при VP2 още един етап на H.264/AVC (MPEG4 Part10) декомпресирането (побитовата обработка – BitStream Processing) се извършва от GPU-то. За съжаление новите BSP/AES модули на GF8600/8500/8400 и 8800GT не поддържат MPEG2 и VC-1 (докато MPEG2 декомпресията не е проблем, за който и да е съвременен процесор, то при VC-1 едноядрените имат нужда от помощ).
При G92 е премахнат е NVI/O чипът като са вградени следните видео изходи: два VGA 400MHz RAMDAC-а, два двуканални TDMS с HDCP за DVI/HDMI и HDTV-Out encoder. За разлика от Radeon HD2/3 при GeForce8 звук през HDMI изхода може да има, само ако на видео платката е предвиден допълнителен вход за аудио кабел, свързан към дънната или звуковата платка.

И двата DVI изхода на GF8800GT са двуканални, но в най-ниския клас продуктите на ATI имат предимство, тъй като Radeon HD2400 има един двуканален (dual-link) DVI (до 2560х1600@60Hz) и един едноканален DVI (до 1920х1200@60Hz) докато GF8500 има само един DVI изход (двуканален), а при GF8400 единственият DVI изход е едноканален.
Текстуриращите групи при G92 също като при GF8600/8500/8400 са разширени – имат по осем адресиращи модула (вместо по 4 както е при G80 базираните GF8800), но не могат да извършват по две филтрирания. Резултатът е, че един процесорен блок на G92/GF8600 поддържа обработката на 8 текстурни адреса или 8 филтрирания, за разлика от блоковете на G80 базираните GF8800, които поддържат по 4 адресирания или 8 филтрирания. Съответно GF8800GT има общо 56 текстуриращи модула (за 56 адресирания/филтрирания), а останалите GF8800 – общо 32 модула (за 32 адресирания/64 филтрирания) за GTX/Ultra или 24 модула (24 адресирания/48 филтирирания) за GTS моделите.

G92 е и първият PCI Express 2.0 графичен ускорител (удвоен пропускателен капацитет на х16 интерфейса от общо 8GB/s в двете посоки на 16GB/s), но при настоящите приложения това не оказва влияние на производителността – ползата от по-бързия интерфейс се проявява при приложения за математически изчисления използващи графичния ускорител (напр. Tesla серията на nVidia).
Броят активирани Stream процесори при G92 е 112 (от общо налични 128, които ще се използват изцяло в бъдещи модели GF8800), блоковете за текстурни адреси и филтриране са по 56, а финализиращите блокове са 16. Основната тактовата е 600MHz, честотата на Stream процесорите е 1500MHz, каналът за достъп до графичната памет е с обща ширина 256-bit, а тактовата честота на паметта е 900MHz/1800DDR.
G92 се състои от 754 милиона транзистора, заемащи 324 кв.мм площ. Броят на транзисторите е по-голям от този на G80 заради допълнителните функционални блокове на G92 (VP2, текстуриращи, видео изходи). От разликата в броя транзистори на GF8500 и GF8600 (GF8500/8400 остава само с един процесорен блок от 16 SP и съответно има само 8 текстуриращи модула за 8 адресирания/филтрирания) можем да направим извода, че при nVidia един процесорен блок с 16 SP е изграден от 79 милиона транзистора.

Производителността на GF8800GT е доста по-висока от GF8800GTS (който е по-скъп) като почти настига GF8800GTX. Две GF8800GT платки в SLI режим са по-бързи от една GF8800GTX, но общо струват по-малко. GF8800GT е по-бърз и от Radeon HD2900XT. Появата на GF8800GT с ниската му цена обезсмисля покупката на GF8800GTS/GTX и GF8600GTS – GF8800GT е точно това, което се очакваше от продуктите нисък клас – нелоша производителност, пълна функционалност и приемлива цена. Платките с GF8800GT са оборудвани с 512МВ или 256МВ памет, а ASUS са обявили и 1GB модел. Sparkle предлагат GF8800GT модел с безвентилаторно охлаждане.

Radeon HD3xxx (RV670)

RV670 представлява сериозен напредък за AMD/ATI. Новият чип се произвежда от TSMC, използвайки 55nm технология (подобрена 65nm, предоставяща известни предимства преди навлизането на 45nm), което е доста смел избор, имайки предвид, че чипът, който на практика заменя (R600), се произвежда чрез 80nm технология. Все пак ATI вече имат опит с 65nm RV630/610, но досега не е имало подобен случай на прескачане на технологични нива. RV670 се състои от 666 милиона транзистора, заемащи 192 кв. мм площ. Според AMD по-фината производствена технология се използва по такъв начин, че най-голям акцент се поставя на понижаване на размерите (оттам и стойността), а на второ място е понижаването на консумираната енергия. Съответно не следва да се разчита на съществена възможност за увеличаване на тактовите честоти (при толкова фини размери не може да се постигнат и трите ефекта едновременно).

Броят Stream процесори (64х5=320), текстуриращи (16) и финализиращи (16) модули при RV670 се запазва същия като на R600 (HD2900), но каналът за достъп до паметта е намален от общо 512-bit на 256-bit (съответно вътрешната пръстеновидна шина е намалена от 1024-bit на 512-bit) – контролерите за достъп до паметта си остават 8, но по 32-бита (вместо 64). 512-битовият канал не успя да помогне съществено на HD2900, тъй като останалите компоненти не успяват да го натоварят (затова можем да очакваме появата на 512-bit модели 55nm R6xx чипове с повече обработващи блокове).

Също като G92 и RV670 поддържа PCI Express 2.0 (оказва се, че и по-старите Radeon HD2 чипове поддържат някои отделни елементи на PCIe2.0 спецификацията) и заимства пълноценен модул за видео декомпресия от продуктите среден и нисък клас – Unified Video Decoder (UVD) с пълна поддръжка на MPEG2, H.264 и VC-1 и разделителни способности до 2560х1600 (мощността на HD2600 стига максимум за 1920х1080p).

По-същественото нововъведение в RV670 е поддръжката на DirectX 10.1 (Shader Model 4.1). DX10.1 представлява неголяма ревизия на DX10 и се очаква заедно със Service Pack 1 за Windows Vista в началото на 2008. DX10.1 добавя задължително филтрирането на 32-битови текстури с плаваща запетая, 4х изглаждане на ръбовете (Anti-Aliasing) и др. PCIe 2.0 заедно с някои от DX10.1 нововъведенията могат да намерят приложение при математическите изчисления и затова AMD вече са обявили FireStream платка, използваща RV670.

CrossFire технологията също е доразвита с RV670, който поддържа дву-, три- и четириплаткова работа (CrossFireX). Не всички приложения успяват да се възползват от многоплатково ускорение, но с всяка следваща версия на драйверите положението се подобрява. Проблем при четириплатковата работа е, че ATX кутиите имат само 7 отвора за платки и не може да се използват видеоускорители, заемащи пространството на два слота/отвора (демо системите на ATI използват две двуслотови и две еднослотови платки). Все още има какво да се желае и по отношение на производителността – при добавяне на втора платка GF8800 постигат с около 10% по-голямо подобрение в сравнение с разлика между един и два Radeon HD3.

RV670 притежава и доста подобрени възможности за пестене на енергия (и съответно за намаляване шума на вентилатора) – т.н. PowerPlay технология следи натоварването на RV670 и съответно променя тактовите честоти и напреженията на чипа между три състояния: „ненатоварено”, „леко натоварено” и „тежко натоварено”. При HD2000 състоянията са само две и се определят не от натовареността, а от режима (2D или 3D), което поставяше в неравностойно положение приложенията за математическа обработка във фонов режим и игрите, пуснати в прозорец, а не на цял екран. Освен това при RV670 част от изчислителните блокове се включват и изключват в зависимост от натоварването.

Влиянието на AMD върху наименованията на продуктите се усеща при RV670 базираните платки. Първоначално се предвиждат два модела: Radeon HD3870 и HD3850. Промяната на последните две цифри замества различните надставки използвани досега (GT, Pro, XT, XTX, GL, GTO, LE, SE, XL), които не показваха ясно коя платка е по-бърза. И двата Radeon HD38xx модела използват един допълнителен PCIe 6-изводен, захранващ куплунг и предоставят два CF конектора за многоплаткова работа. HD3870 използва RV670 чип, работещ на 775MHz, 512МВ GDDR3/4 памет, работеща на 1125MHz/2250DDR (72GB/s), консумира 105W и охладителят му заема пространството над съседния PCI/e слот. HD3850 използва чип, работещ на 670MHz, 256МВ GDDR3 памет, работеща на 830MHz/1660DDR (53GB/s), консумира 95W и охладителят му не заема пространството над съседния PCI/e слот. Естествено, производителите на видеоплатки предлагат и модели с малко по-високи тактови честоти или по-голям обем памет.

Благодарение на по-ниската консумация на енергия при HD38xx е отстранен един от съществените проблеми на HD2900XT – шумът на вентилатора вече е около 40dB – подобно на GF8800GT. Sapphire предлагат и безвентилаторен HD3850 модел.

HD38xx платките за разлика от HD2900XT нямат Theater чип и не поддържат Video-In, а само HD/TV-Out и DVI/HDMI/VGA.
Също като GF8800GT и GF8800GTS – HD3870 е едновременно по-бърз и значително по-евтин от HD2900XT. HD3850 е малко по-бавен от HD2900XT, но е значително по-бърз от всички платки среден клас (GF8600GTS/GT, HD2600XT/Pro). HD3850 е по-бърз и от продуктите минало поколение като GF7950GT и Radeon X1950XTX. Разликата в производителността между GF8800GT и HD3870 е около 10% в полза на GF8800GT – горе-долу с толкова пък е по-евтин Radeon HD3870, т.е. и двете платки са еднакво изгодни. GF8800GT е малко по-бърз (и по-скъп), а HD3870 има по-богата функционалност (VC-1 декомпресия и DX10.1).

Въпреки че двучиповите HD2600X2 платки не добиха особена популярност, при липсата на конкурент на GF8800GTX/Ultra можем да очакваме появата на HD3850X2 (две HD3850 платки в CF режим са почти равни на GF8800GTX по производителност) и HD3870X2.

Автор: Стоян Спахиев