GeForce GTX и Radeon HD4800 – част 2

 SINCE 1998
  • Играй си играта, човече!
author image by PC Mania | Archive | 0 Comments | 16 сеп. 2008

Малко след появата на nVidia GeForce GTX беше обявен и новият чип на ATI – RV770. Въпреки че формално той не е позициониран срещу върховия модел на nVidia, на практика резултатите, които показва, са неочаквано добри и успяват да възвърнат на ATI ако не цялата лидерска позиция, то поне подялбата й с nVidia. Резултатът от този обрат е същественото намаление на цените на върховите GeForce модели.

Radeon HD4800 (RV770)

Основните характеристики на RV770 не са претърпели промяна спрямо предшественика му RV670 (Radeon HD3800) – поддържа DirectX10.1, OpenGL 2.1, използва PCI Express 2.0 интерфейс и притежава AvivoHD/UVD2 модул за подпомагане на декомпресията на видео съдържание по стандартите MPEG2/DVD, MPEG4/H.264 и VC-1. Главната отличителна черта на новия чип е значително по-големият брой обработващи модули. Запазва се структурата от SIMD масиви, съдържащи по 16 Stream процесора (SP) и 1 текстуриращ модул. Всеки SP съдържа 5 изчислителни блока (4 изпълняващи най-масовите операции и един, който може да изпълнява и по-сложни инструкции), а всеки текстуриращ модул – 4 блока за обработка на текстури.

При RV770 към всеки SIMD масив е добавена и 16KB L1 памет. Броят масиви е увеличен два пъти и половина (!) от 4 на 10, т.е. общия брой Stream процесори от 320 (RV670) е станал 800 (RV770), а текстуриращите блокове от 16 са станали 40 (съотношението между блоковете за обработка на пиксели и на текстури се запазва същото като при RV670). Контролерите за достъп до паметта са четири 64-битови (общо 256-bit) и съответно финализиращите блокове (ROP) остават 16 (по четири с всеки контролер).

По този начин съотношението обработващи/финализиращи блокове се променя в полза на обработващите (т.е. ATI/AMD очакват за всяка изобразена точка на екрана да бъдат извършвани повече и по-сложни изчисления). Към всеки контролер се запазва L2 кеш паметта. Относително тесният канал за достъп до паметта (наполовина на GeForce GTX280 с неговите 512-bit) в голяма степен е компенсиран чрез обновените контролери – RV770 поддържа два нови типа памет – „обикновена” DDR3 (т.е. в по-ниските сегменти можем да очакваме по-евтини платки, които използват DDR3, вместо по-скъпите GDDR3 чипове) и GDDR5. Предимството на GDDR5 спрямо GDDR3/4 е в удвоената производителност – на всеки такт GDDR5 предава по 4 бита/извод за разлика от GDDR3/4, които предават по 2, т.е. при работа с GDDR3/4 на 900MHz с 256-битов интерфейс се получава скорост от 1800DDR и съответно пропускателен капацитет 57,6GB/s, а при GDDR5 със същите параметри – 3600 и 115,2GB/s.

RV770 добавя поддръжка на FP64 изчисления в Stream процесорите си като GeForce GTX (GF9800 и Radeon HD3870 поддържат FP32 в своите Stream процесори, текстуриращи и финализиращи модули) и също така е подобрена производителността при режимите за изглаждане на ръбове (Anti-Aliasing).

Вътрешната организация на връзките между елементите на графичния ускорител е изцяло променена в сравнение с пръстеновидния интерфейс на RV670 (512-bit обща широчина – по 256-bit за четене и запис) и R600 (1024-bit общо). RV770 използва класически комутатор (switch) с портове за четирите контролера на паметта, PCIe интерфейса, UVD2 модула, визуализиращия модул (който съдържа TMDS/DVI/HDMI, RAMDAC/VGA и TV-Out блоковете), съвкупността от изчислително-обработващи модули (достъпа до тях се осъществява посредством 2048-bit шина – пореден рекорд) и CrossFire модула за многочипова/многоплаткова работа (Composition Engine). Използването на комутатор вместо пръстеновиден интерфейс позволява по-ефективно използване на ресурсите (и намалена консумация на енергия), тъй като модулите, които не се нуждаят от огромен пропускателен капацитет, няма нужда да използват 512-bit или дори 1024-bit интерфейс.

Допълнително предимство е и намаленото време за връзка между модулите – всеки два модула са „на разстояние” 1 елемент (централния комутатор) за разлика от пръстеновидната шина, при която разстоянието варира между 0 (при съседни елементи) и половината от общия брой елементи.

CrossFire модулът на RV770 запазва двата CF порта със скорост 0.9GB/s (за връзка между до 4 видеоплатки) и е разширен с допълнителен SidePort интерфейс за връзка между два чиповете в една двучипова платка. SidePort интерфейсът по своите характеристики е близък до PCIe 2.0 (и има същата скорост – по 8GB/s във всяка посока). За съжаление според AMD активирането му не си струва на този етап, тъй като производителността не се увеличава достатъчно, за да си заслужава увеличената консумация на енергия вследствие на активацията (по-добре би било този избор да се остави на потребителите чрез настройка в драйверите).

По отношение на външните интерфейси няма съществена промяна спрямо RV670 – поддържа се едновременна работа с два от видео изходите. Поддържат се 10-битови цветове (30-bit изходи). Налични са два двуканални (dual-link) DVI изхода (до 2560х1600@60Hz) с вградена HDCP поддръжка (за неразкодирани дискове/файлове) и за двата, два VGA 400MHz RAMDAC (до 2048х1536@85Hz) и един HD/TV-Out (до 1920х1080i) – S-Video, композитен (1 RCA куплунг) или компонентен (3 RCA куплунга за HDTV).
Отличителна черта на Radeon HD фамилията е поддръжката на „пълен HDMI” интерфейс – звук и картина в един конектор. Към DVI портовете на Radeon HD (и GeForce 8/9/GTX) могат да се включват DVI-към-HDMI адаптори. При GeForce моделите се препредава звукът, постъпил чрез SPDIF кабел от дънната или звуковата платка, докато Radeon HD имат вграден собствен аудиоконтролер. GeForce GTX са ограничени от възможностите на SPDIF интерфейса и поддържат препредаването на двуканален некомпресиран сигнал и на 5+1 канален AC3 или DTS сигнал. Контролерът на RV670 поддържа двуканален некомпресиран и 5+1 канален AC3 звук, а този в RV770 е разширен до 7+1 канален LPCM (некомпресиран) и AC3. От ATI обещават в бъдещи версии на драйверите да добавят поддръжка и за Dolby TrueHD и DTS-HD, но такава все още няма.

RV770 се състои от 956 милиона транзистора, заемащи 260 кв.мм площ, произведени чрез 55nm технология (най-фината на разположение във фабриките на TSMC). Предшественикът му RV670 при същата производствена технология заема 192 кв.мм, а е изграден от 666 милиона транзистора, т.е. RV770 оползотворява в по-голяма степен площта (поне дотолкова доколкото има по-голям брой транзистори на кв.мм). Структурата на блоковете (и/или на отделните транзистори) в RV770 е оптимизирана така, че площта от силициевата пластина, която заемат, да е по-малка от тази при RV670. Тази оптимизация заедно с уголемяването на самата пластина дават възможност за драстичното увеличение на броя обработващи блокове спрямо RV670.

RV770 има по-голям брой транзистори на кв.мм не само в сравнение с RV670, но и с G92b (55nm, 754 милиона транзистора, 260 кв.мм) на nVidia (използван в GF9800GTX+ и други GF9). ATI по-ефективно използват площта, ако приемем, че транзисторите на nVidia и ATI извършват еднакво количество полезна дейност, но това не е точно така – nVidia може би залагат на такива размери и разположение (на транзисторите), че крайната тактова честота да е по-голяма. Въпросът се свежда до това, като цяло след като се вземат предвид всички компромиси и дизайнерски решения, кой продукт е по-бърз в реалните приложения.
Stream процесорите при GeForce GTX (GT200) работят на доста по-високи тактови честоти в сравнение с тези на RV770, но за сметка на това са доста по-малко на брой (и като цяло силите са изравнени). При текстуриращите и финализиращите блокове ситуацията е обратната – RV770 има по-малко, но по-бързи блокове в сравнение с GT200 (предимството обаче остава за GT200). Контролерите за паметта при RV770 са с наполовина по-малка обща ширина в сравнение с GT200 и двойно по-бързата теоретично би била достатъчна, за да компенсира това, но все още максималните тактови честоти на GDDR3 и GDDR5 не са изравнени (GDDR3 се предлага в малко по-бързи варианти) и затова при върховите модели GT200 запазва преднината си.

При всички тези сравнения между чиповете на nVidia и AMD/ATI трябва да се има предвид решението на ATI във върховия сегмент да предлага двучипови решения, т.е. да заложи на по-малък „базов” чип (който има предимства като енергоефективност и по-малки производствени разходи), а не на максималния възможен.

Платките

Засега се предлагат три основни типа видео платки с RV770 чип. Radeon HD4850 използва чип, работещ на 625MHz (при ATI Shader модулите и останалата част от чипа работят с една и съща тактова честота за разлика от GeForce8/9/GTX) и GDDR3 памет, работеща на 933MHz/1986DDR (63,6GB/s). HD4850 консумира около 110W, захранва се с един допълнителен 6-изводен конектор и охладителят му не заема пространството над съседния PCI/e слот. При HD4870 се използва чип, работещ на 750MHz и GDDR5 памет, работеща на 900MHz/3600 (115,2GB/s).

HD4870 консумира около 160W, захранва се с два допълнителни 6-изводни конектора и охладителят му заема пространството и над съседния PCI/e слот. Radeon HD4850 както и HD4870 се предлагат във варианти с обем на паметта 512МВ или 1GB. Наследникът на двучиповия HD3870X2 е Radeon HD4870X2. За разлика от HD3870X2, при който чиповете RV670 работеха на по-висока честота в сравнение с HD3870, при HD4870X2 всички показатели са идентични с HD4870. Подобрение в сравнение с HD3870X2 се вижда в новия комутаторен чип, който вече поддържа PCIe 2.0 и съответно премахва едно потенциално тясно място в двучиповите платки. Засега се предлагат HD4870X2 единствено с 2х1GB памет. В скоро време се очакват HD4850X2 модели както с 2х1GB, така и с 2х512МВ. HD4870X2 консумира около 286W, а HD4850X2 – около 230W. Двучиповите модели се захранват с един допълнителен 6-изводен конектор и един 8-изводен, а охладителите им заемат пространството и над съседния PCI/e слот.

При всички HD4800 модели чиповете RV770 се използват без дезактивирани модули – разликите са единствено в тактовите честоти. Едночиповите HD4800 имат по два CrossFire извода, а двучиповите – по един. Запазва се възможност от HD3800 да се правят всякакви възможни комбинации от HD4870/4850/X2 платки стига общия брой чипове да е най-много четири.

По отношение на производителността HD4850 попада между GF9800GTX+ и GTX260, HD4870 – между GTX260 и GTX280, а HD4870X2 изпреварва дори двучиповите GF9800GX2 (което в повечето случаи е по-бързо от GTX280). Поради недостатъците на многочиповите режими (с повече от два чипа) две GF9800GX2 в QuadSLI режим и две HD4870X2 (или четири HD4870) в CF са по-бавни от три GTX280 в 3-way SLI. Естествено в зависимост от конретните приложение, разделителна способност и настройки в някои случаи GeForce имат по-голямо предимство, а в други – Radeon.

Успехът на новия чип на ATI се подчертава и от наличието на по-разнообразен набор продукти, които го използват. Докато GT200 все още се предлага най-вече с референтния дизайн за платка от nVidia, то при HD4800 някои производители на видео платки вече проявяват творчество. Palit например предлага модел с Turbo бутон. В зависимост от положението му платката използва различен BIOS чип – единият активира стандартните тактови честоти, а другият – фабрично завишени.

Автор: Стоян Спахиев