Radeon HD–DirectX10 серията на ATI/AMD: част1

by PC Mania | Archive | 0 Comments | 11 авг. 2007

Най-голямата новина, свързана с ATI след поглъщането й от AMD, бе забавянето на пуска на DirectX10 видеоускорителите й. Събитието най-накрая се състоя около половин година, след като конкурентът nVidia пусна Geforce8. За това време nVidia пуснаха на пазара и моделите си от среден и нисък клас. ATI/AMD компенсират забавянето като обявяват направо цяла гама DX10 чипове – Radeon High Definition 2900, 2600 и 2400.

Radeon X1000 – последни модификации

Между излизането на Geforce8 и появата на Radeon HD2000 ATI пуснаха няколко „нови” продукта. X1950XT представлява малко по-евтин вариант на дотогавашния флагман X1950XTX – честотата на чипа му е намалена от 650 MHz на 625 MHz и използва по-бавна памет – 900 Mhz/1800 DDR вместо 1000 Mhz/2000 DDR. X1950GT е вариант на осъвременения X1950Pro (X1950 с вградена CrossFire поддръжка без Master платки) с памет, работеща на 600 Mhz/1200 DDR вместо 690 Mhz/1380 DDR. Radeon X1800XL с 512 MB бе наречен X1800GTO2, след като първата X1800GTO платка спечели голяма популярност (заради доброто съотношение цена/производителност). X1600Pro получи малко по-бърза памет (400 Mhz/800 DDR вместо 390 Mhz/780 DDR) и цели две нови имена – първоначално X1300XT, а по-късно “чист” X1650. Radeon X1300 и X1600 се сдобиха с превъплъщения за преносими компютри с наименования, увеличаващи хаоса и объркването – X2300 и X2500. Допълнително към тях се присъедини и HD2300 (X1300 с една от функциите на HD2000 – UVD декодер за H.264/VC-1 видео).

След поглъщането на ATI от AMD и по времето, когато X1950XTX все още беше най-бързият видеоускорител (преди появата на GF8 – когато nVidia бяха принудени да пуснат двуплатковите GF79xxGX2), беше пусната юбилейна серия Radeon X1950XTX Über edition. Тактовите му честоти са леко завишени спрямо стандартните за X1950XTX – чип, работещ на 670 MHz вместо 650 MHz и памет на 1050 Mhz/2100 DDR вместо 1000 Mhz/2000 DDR. Комплектът Radeon Über edition се състои от куфарче с две платки (стандартна и Master-платка за CrossFire), пълен комплект аксесоари и сертификат подписан от Дейв Ортън (CEO на бившата ATI). За целия свят са произведени са едва 500 броя Über edition.

HD2900 (R600)

Верни на досегашните си твърдения ATI реализират DirectX10 поддръжката чрез унифицирани изчислителни модули (Unified Shader 4.0). R600 съдържа 64 суперскаларни Stream процесора, всеки от които има по 5 изчислителни блока и блок за обработка на разклонения. 64 SP-та са разпределени в четири SIMD масива по 16, всеки от които има по 3 порта за подаване на информация (един обслужващ текстуриращите модули и два за многонишковия блок за разпределение на задачите).

Текстуриращите модули се явяват пети масив по отношение на разпределителния блок и съответно имат два входящи порта, които го обслужват. R600 разполага и с малък допълнителен „команден процесор”, който разтоварва централния процесор на компютъра от обслужването на видеодрайвера.

Текстуриращите модули са разпределени в 4 групи по 4 и естествено поддържат всички нововъведения на DX10 (4х32bit HDR и т.н.). R600 има три блока вътрешна памет, която обслужва текстуриращите модули: Vertex Cache (32KB, осем пъти повече от X1950), Texture Cache L1 и L2 (256KB).

Stream процесорите поддържат изцяло FP32 и IEEE754 и могат да изпълняват до 5 MAD обработки/цикъл или 4 MAD, заедно с една по-сложна операция. В това отношение архитектурата R600 се отличава значително от G80 (GF8800) – при R600 правилното разпределение на инструкциите ще оказва по-голямо влияние на производителността (т.е. има потенциал бъдещи оптимизации в игрите и драйверите да се отразят положително, но от друга страна, това означава, че недотам оптимизиран код ще се изпълнява по-бързо при G80).

Финализиращите модули на R600 са разпределени в 4 групи по 4. Алгоритмите за изглаждане на ръбове (anti-aliasing) също са доразвити. Режимът MSAA (Multi-Sample AA) 6x е заменен с 8х и подобно на GF8 с CSAA (Coverage Sampling AA) и при R600 MSAA обработката се подсилва чрез CFAA (Custom Filter AA) или ED (Edge Detect filter AA). Като качество на изображението ED дава най-добри резултати, след това е CSAA и накрая CFAA. Активирането на CFAA/ED при 4x MSAA дава еквивалента на 12x FSAA (Full-Screen AA), a при 8x MSAA – на 24х FSAA. Засега GF8 поддържа максимум 8xQ MSAA или 4x MSAA с CSAA, което е аналог на 16x FSAA.
Освен задължителните за DX10 Pixel, Geometry и Vertex Shader в R600 е запазен и Tessellation модула от Xenos (видеоускорителят в Xbox360, който е разработен от ATI). Той позволява изработването на по-детайлни изображения с минимално натоварване на процесора, паметта и шините. За съжаление едва ли игрите (освен тези, първоначално разработвани за Xbox360) ще го използват при положение, че такъв засега има само в ATI ускорителите.

R600 е единственият чип от Radeon HD фамилията, който няма Universal Video Decoder (UVD). Подобно на Geforce8 върховият модел подпомага разкомпресирането на MPEG4 (H.264, VC-1) потоците само частично и то използвайки Stream процесорите си. Първоначално се очакваше R600 да използва UVD също като по-малките Radeon HD чипове. Това води на мисълта, че UVD засега е деактивиран в R600 поради изникнал в последния момент проблем. При GF8800 (G80) ситуацията е различна – там просто се използва по-стария VP1, тъй като VP2 се появи месеци по-късно, заедно с GF8600/8500.

R600 запазва вътрешния пръстеновиден интерфейс за обмен на данни, но го разширява до ширина 1024-bit (512-bit за четене и 512-bit за запис). На пет места върху пръстена са разположени входно/изходни модули. Четири от тях имат по два 64-битови канала за достъп до локалната памет (т.е. общо 512-bit интерфейс – най-големият измежду настолните видеоплатки), а петият е PCI Express x16 интерфейс за връзка с чипсета.
R600 запазва осъвременяванията по отношение на многоплатковата работа (CrossFire) въведени с X1950Pro – две и повече платки могат заедно да изработват картината като подобно на SLI обменът на данни помежду им се осъществява чрез конектори между платките (по два на платка) или чрез PCI Express интерфейса. Поддържа се разделителна способност до 2560х2048@60Hz.

Както всички съвременни видеоускорители и R600 поддържа едновременна работа с два от видео изходите си. Поддържат се 10-битови цветове (30-bit изходи). R600 има два двуканални (dual-link) DVI изхода (до 2560х1600@60Hz) с вградена HDCP поддръжка (за неразкодирани дискове/файлове) и за двата, два VGA 400MHz RAMDAC (до 2048х1536@85Hz) и един HD/TV-Out (до 1920х1080i) – S-Video, композитен (1 RCA куплунг) или компонентен (3 RCA куплунга за HDTV). Досега обявените HD2900 платки имат и Theater 200 чип, който се използва за Video-In (S-Video и композитен сигнал, не се поддържа HDTV), т.е. платката става ViVo (Video-In/Video-Out). Все още няма Geforce8 ViVo платки, но това не е съществена загуба, тъй като повечето хора, нуждаещи се от „вкарване” на видеосигнал, така или иначе си купуват допълнителна TV тунер платка.

Отличителна черта на Radeon HD фамилията е поддръжката на „пълен HDMI” интерфейс – звук и картина в един конектор. Към DVI портовете на Radeon HD (и Geforce8) могат да се включват DVI-към-HDMI адаптори. За разлика от Geforce8 в Radeon HD е вграден и аудиоконтролер (поддържа до AC3 5+1 канала).

Въпреки късната поява на R600 драйверите ATI Catalyst изглеждат по-завършени в сравнение с ForceWare за GF8, които след няколкото нови версии под Windows Vista все още имат доста функции, които не се поддържат – QuadSLI (работа с четири ускорителни чипа/платки), SLI с DX10 приложения, SLI Anti-Aliasing (допълнителните режими за изглаждане на ръбовете, които биха могли да се активират при многочипова работа) и др.

R600 се произвежда по 80nm технология и е изграден от 700 милиона транзистора, заемащи 420 кв.мм площ (G80 е изграден от 681 милиона транзистора, заемащи 500 кв.мм площ). R600 използва една и съща тактова честота за целия чип, която е по-висока от „основната” при G80 (за G80 се използва по-стара 90nm производствена технология), но по-ниска от „специалната”, използвана за Shader модулите на G80.
Засега е предвиден един-единствен модел платка с R600 – Radeon HD2900XT, с чип, работещ на 743 MHz и 512 MB памет, работеща на 825 Mhz/1650 DDR (106GB/s пропускателен капацитет). По-късно се очакват HD2900Pro и модели с 1 GB (1024 MB) памет (подходящи за неграфични приложения, използващи видео платката за изчисления), подобно на специалната Stream версия на Radeon X1900. nVidia вече предлагат Quadro FX5600 базиран на GF8800, който е с 1.5GB памет.

HD2900XT е дълга 24 см (по-къса от GF8800GTX и по-дълга от GF8800GTS), има два CrossFire конектора, консумира около 215 W (колкото GF8800Ultra), охладителят й заема пространството над съседния PCI/e слот (както всички GF8800) и е по-шумна с 5-10dB от GF8800GTX и GF8800Ultra, която е относително тиха (43-44dB – колкото GF8800GTX, което е доста добре, имайки предвид по-високите тактови честоти).
HD2900XT използва два PCIe-куплунга за допълнително захранване. Единият е стандартен 6-изводен (до 75 W), а другият – 8-изводен по спецификацията PCI Express 2.0 (предоставя до 150 W). 8-изводният е обратно-съвместим с 6-проводните кабели, но тогава OverDrive функциите (за overclock честоти) в драйверите се изключват.

Производителността и цената на HD2900XT/512 MB са сравними с тези на GF8800GTS/640 MB (която обаче консумира двойно по-малко енергия от HD2900XT – само 108 W – и съответно отделя много по-малко топлина), но и двете платки изглеждат прекалено скъпи в сравнение с GF8800GTS/320MB, която е по-евтина, но доста близо до тях по производителност.

Най-вероятно първенството при видеоускорителите ще продължи да се държи от nVidia поне докато ATI не преминат към 65 nm производствена технология и при върховите си модели (за HD2600 и HD2400 вече се използва 65 nm), което ще позволи по-високи тактови честоти. В това отношение обаче nVidia също имат доста резерв – за техният върхов модел все още се използва 90 nm, което означава, че GF8 архитектурата при една и съща производствена технология би трябвало да съществено да изпревари HD2000 (90nm G80 е по-бърз от 80nm R600). При положение, че и ATI и nVidia използват фабриките на TSMC единственото, което ги отличава е вътрешната архитектура на чиповете. Въпреки поглъщането на ATI засега AMD не смятат да поемат производството на Radeon чиповете в собствените си фабрики – капацитетът им е необходим за Athlon процесорите, а и за такава смяна ще са необходими и корекции на топологията на чиповете.

Автор: Стоян Спахиев