Нанометровият поход на nVidia

by PC Mania | Archive | 0 Comments | 09 юли 2009

През 2008-ма nVidia прехвърлиха всичките си продукти от среден и нисък клас (серията GeForce 9) от чипове, произведени чрез 65nm технология (G9x) към такива чрез 55nm (G9x/b). В началото на 2009-та преходът към по-фината производствена технология бе извършен и в GeForce GTX200 серията, където нуждата от по-малки чипове беше най-голяма с цел ограничаване на разходите за производството им, намаляване на консумацията на енергия и съответно опростяване на дизайна на платките и охладителите. Благодарение на тези подобрения nVidia не само леко увеличиха производителността на върховото си едночипово решение, но и успяха да реализират двучипов GeForce GTX продукт.

AMD извършиха прехода към 55nm още по времето на Radeon HD3000, но също обявиха нови продукти – 55nm HD4890 и първия 40nm графичен ускорителен чип – HD4770.

GeForce GT200b

Използването на по-фина производствена технология при GT200b (55nm) спрямо GT200 (65nm) намалява размера на силициевата пластина от 576 кв. мм на 470 кв. мм. Броят транзистори се запазва един и същ и за двата чипа (1400 милиона), което означава, че функционално те не се различават. За съжаление се запазва и външният NVIO чип, предоставящ различните видеоизходи – DVI, VGA и т.н. Най-вероятно чак при обновяването с 40nm технология ще получим отново GPU от nVidia, което не се нуждае от допълнителни чипове. Предимствата на новите чипове са в по-малките производствени разходи и възможността за по-високи тактови честоти или по-малката консумация на енергия. Консумацията на платките с GT200b е между 185W и 220W (в зависимост от тактовите честоти) и съответно всички те са с по два 6-изводни PCIe конектора за допълнително захранване (флагманът на 65nm чиповете GTX280 се нуждаеше от един 6-изводен и един 8-изводен конектор). Охладителите на всички платки заемат пространството и над съседния PCI/e слот, а освен това се наблюдава и тенденция HD/TV-Out изходът да се среща все по-рядко. Понякога на неговото място има HDMI изход (който спокойно може да се реализира и с обикновен DVI-към-HDMI преходник), но в други случаи просто е премахнат аналоговият телевизионен изход.

GeForce GTX260 Core216

Първоначалните GeForce GTX модели GTX260 и GTX280 не получават аналози, използващи новите 55nm чипове, и съответно такива платки вече се намират трудно. Най-малкият GT200b модел, който предлага nVidia, е абсолютен еквивалент на 65nm GTX260 Core216 (216 Shader процесора, 72 текстуриращи модула, 28 финализиращи/ROP модула и 448-битов интерфейс за достъп до GDDR3 паметта), работещ на същите тактови честоти като досегашните 65nm чипове (1242MHz за Shader процесорите, 576MHz за останалата част от GPU-то и 999MHz/1998DDR за паметта). Препоръчителният обем памет се запазва 896 MB, но се предлагат и модели с удвоен размер. nVidia обновиха и референтния дизайн на платките (намалявайки броя слоеве от 14 на 10 и въвеждайки някои други промени), чрез които се намаляват производствените разходи. Прекият конкурент на GTX260 Core216 е Radeon HD4870 с 1GB GDDR5 памет. Производителността и цената им е доста близка, така че изборът между тях зависи от конкретните налични модели видеоплатки (в зависимост от това дали имат леко повишени тактови честоти, окомплектовката и т.н.)

GeForce GTX275

nVidia отвърна на новите Radeon HD4890 като пусна свой чип, позициониран над GTX260 Core216 и съвсем малко под GTX280 – GeForce GTX275. При него са активирани всички изчислителни блокове на GT200b чипа – 240 Shader процесора и 80 текстуриращи блока (като GTX280/285), но от GTX260/GTX260 Core216 са заимствани ограниченията при финализиращите модули (ROP) и контролерите за достъп до паметта, които са съответно 28 бр. ROP и общо 448-битa. По отношение на изчислителните си възможности (Shader и текстуриращи операции), GTX275 е по-мощен от GTX280, тъй като благодарение на 55nm технологията достига честота 1404MHz за Shader процесорите (срещу 1296MHz при GTX280) и 633MHz за останалата част от GPU-то (срещу 602MHz). При големите разделителни способности по-широкият интерфейс за достъп до паметта (и съответно по-големият й обем заедно с повечето на брой финализиращи модули) на GTX280 (512-bit) успяват да му помогнат да излезе напред, но като цяло GTX275 е по-изгоден от GTX280 (не случайно вторият не получава обновени 55nm модели). Препоръчителният обем памет при GTX275, също като при GTX260 Core216, е 896MB, но с честота 1134MHz/2268DDR. При разделителна способност до 1920х1200 включително (24” монитор), HD4890 изпреварва GTX275, а при по-голяма (30” монитор, 2560х1600) по-бърз е GTX275. Цените им също са близки, но HD4890 в общия случай е по-евтин, а срещу малко по-голяма сума може да се вземе уникалната засега двучипова видеоплатка HD4850X2 на Sapphire (никой друг производител не предлага HD4850X2) с четири DVI изхода и HD/TV-Out.

GeForce GTX285

Новият едночипов флагман на nVidia e GeForce GTX285 – достоен заместник на GTX280 и безспорен лидер по производителност (единственият продукт на AMD/ATI, който е по-бърз, е двучиповият HD4870X2, който обаче е и по-скъп). При GTX285 няма дезактивирани модули на GT200b чипа – използват се всичките 240 Shader процесора (1476 MHz), 80 текстуриращи и 32 финализиращи модула (648 MHz) и 512-битов интерфейс за достъп до GDDR3 паметта (1242MHz/2484DDR) с препоръчителен обем 1 GB.

GeForce GTX295

Върховият видеоускорител към момента е GeForce GTX295. Той представлява двучипов продукт, подобен на GeForce 9800GX2 – две платки, всяка със свои чипове памет, GT200b и NVIO, са обединени в общ корпус. На едната от платките се намира PCI Express 2.0 x16 интерфейса и комутаторният чип NF200, към който са свързани двата GT200b. Платките са монтирани една срещу друга, така че чиповете им споделят един общ радиатор по средата. Вентилаторът също е общ и е разположен по средата между платките като вкарва „пресен” въздух през два големи отвора в задния край на платките (изрязването на тези отвори е операция, която не се използва често и съответно покачва цената), а изхвърля загрелия въздух напред през отвори в задната планка и нагоре. Към момента GeForce GTX295 платките се произвеждат по поръчка (и дизайн) на nVidia в избрани китайски фабрики, а „производителите” имат грижата за етикети, окомплектовка, кутии, маркетинг и разпространение. Поради това разнообразието от модели засега не е особено голямо, но се очаква в скоро време да се появят модификации с два чипа върху една платка (което опростява и поевтинява крайния продукт), които да се изработват от всеки производител както останалите видеоплатки от по-нисък клас.

При GTX295 са активирани всички изчислителни блокове на GT200/b чиповете – по 240 Shader процесора и 80 текстуриращи блока (като GTX280/285), но от GTX275/GTX260/GTX260 Core216 са заимствани ограниченията при финализиращите модули (ROP) и контролерите за достъп до паметта, които са съответно по 28 бр. ROP и 448-битa ширина на канала за достъп до паметта за всеки GT200b чип. Тактовите честоти на GTX295 са сходни с тези на GTX260 Core216 (съответно са по-ниски от тези на GTX285/275), тъй като охлаждането е затруднено от наличието на два чипа в същия обем като на едночиповите платки. При GTX295 Shader процесорите работят на 1242 MHz, останалите модули на GPU-то на 576 MHz. Паметта работи на 1000 MHz/2000 DDR и е с обем по 896 MB за всеки чип (общо 1792 МВ за двата). Цената на GTX295 е космическа (около 1000 лв.), а производителността – по-ниска от тази на две GTX275 платки, работещи в SLI режим (GTX275 имат същите изчислителни ресурси, но работят на по-висока тактова честота). Естествено две GTX275 платки биха заели пространството над четири PCI/e слота, което отговаря на QuadSLI конфигурация от два GTX295 (общо четири GT200b чипа).

За съжаление все още доста от игрите не успяват да се възползват пълноценно от третия и четвъртия чип и производителността рядко се покачва задоволително при добавянето на втори GTX295. Затова QuadSLI остава запазена територия само за най-върлите феновете на върховите постижения, разполагащи със съответния бюджет. GTX295 са с два DVI-I изхода (dual-link DVI + VGA), HDMI изход и светодиоди, показващи главния видеоизход и дали всички необходими захранващи кабели са поставени. Консумират около 289W и съответно освен PCIe x16 слота използват допълнителни конектори за захранване (един 6-изводен и един 8-изводен).

ASUS имат намерение на подобрят рекорда на GTX295 като направят свой собствен дизайн за двучипов видеоускорител („Republic of Gamers: Mars”), който ще използва два GTX285 чипа (т.е. няма да има дезактивирани модули и ще работи на най-високите GT200b честоти). Паметта му ще е с обем 2х1GB и ще работи на 1200 MHz/ 2400DDR (малко по-ниска от 1242 MHz/ 2484 DDR при GTX285). ASUS Mars е доста сходен с GTX295 (използва две платки с радиатор и вентилатор по средата), но за разклоняване на PCI Express интерфейса използва чужд чип вместо NF200 на nVidia. Очаква се ASUS Mars да бъде разпознаван като GTX295 и съответно няма нужда от специални драйвери и може да се използва по двойки в QuadSLI режим. Ако се стигне до производство, най-вероятно ще бъдат направени само 1000 бройки с крайна цена около 1700$

Заедно с новите 55nm чипове nVidia обновиха и ForceWare драйверите си като отново активираха функцията за стереоскопични изображения (аналогични на IMAX 3D) – чрез използването на специални поляризирани очила кадрите се пропускат последователно или само към лявото или само към дясното око и съответно изображението се променя така, че човешкия мозък си изгражда илюзията, че наблюдава реални триизмерни обекти. Този процес обаче изглежда натоварва мозъка (който подобно на MPEG4/H.264 декодер трябва от намалено количество информация да възстанови пълната картина) и не случайно IMAX филмите не са по 2-3 часа като „Властелина на пръстените“, а по 30-45 минути. Освен специални очила за активирането на GeForce 3D Vision (това е новото наименование на тази функция, за която сме говорили и преди), не е необходима поддръжка от страна на съответната игра. По-заетите хора може би ще харесат тази технология, тъй като главоболието след първия половин час игра ще ги принуди да се откажат от „удоволствието” и да се захванат със задълженията си.

Такъв беше ефектът при предишния опит за въвеждане на 3D очила при GeForce видеоускорителите (по времето на GeForce FX), но според nVidia сегашните видеоускорители са достатъчно мощни да изграждат по 120 изображения в секунда (120Hz или по 60Hz/око) за разлика от тогавашните. Това е и последното изискване, за да може да се използва GeForce 3D Vision – мониторът трябва да поддържа 120Hz опресняване (вече има 1-2 такива LCD монитора и телевизора, няколко прожектора, а доста от архаичните CRT монитори с по-добри характеристики също биха свършили работа) заедно с DVI/HDMI интерфейса (при 2560х1600 няма да стане), GPU-то и процесора (т.е. компютърът като цяло трябва да има необходимата производителност). GeForce 3D Vision номинално се поддържа от GeForce 9600GT нагоре (8800GT/GTS/GTX/Ultra, GTS150, GTS250, всички GF9800 и всички GTX).

GeForce 9

nVidia и производителите на видеоплатки пуснаха няколко т.н. „Green” модификации на GF9 продукти. GeForce 9800GT Green консумира само 75W (вместо стандартните 115W) и съответно няма нужда от допълнителен конектор за захранване. Аналогичен е и случаят с GeForce 9600GT Green, който консумира 59W вместо 96W (и съответно е без допълнително захранване), но при него са намалени и тактовите честоти (Shader процесорите работят на 1500 MHz вместо 1625 MHz, а останалата част от GPU-то на 600 MHz вместо 650 MHz).

За производителите на компютри с малки размери (Small Form Factor) е предвиден GF9800S, чийто корпус е с по-малък габарит от стандартния. Типично в стила на nVidia по отношение на наименованията GF9800S всъщност представлява GF9600GT Green с малко по-бавна памет (800MHz/1600DDR вместо 900MHz/1800DDR) и няма нищо общо с който и да било от GF9800 моделите.

Функционално GeForce 8, GeForce 9 и GeForce GTX почти не се различават като GF8 и GF9 дори в някои случаи споделят едни и същи чипове (GF GTX добавят повече на брой изчислителни блокове и съответно се отличават поне по производителност). Въпреки това, по същите маркетингови съображения, каквито обуславяха преименуването от GF8 на GF9, се очакваше от своя страна GF9 да се превърне в GeForce G/GT/GTS (като подгласник на GeForce GTX). Поредното преименуване бе изпълнено само частично.

Под наименованието GeForce GTS250 всъщност се крият преименувани 9800GTX+ продукти – използваният чип е същият (G92b), конфигурацията на изчислителните му модули е същата и препоръчаните тактови честоти се запазват 1836 MHz за Shader процесорите, 738 MHz за останалите модули на GPU-то и 1100 MHz/ 2200 DDR за паметта. Единственото нововъведение, което nVidia правят, е в новия референтен дизайн за 9800GTX+/GTS250 платките – захранването е заменено с по-ефективна схема, което води до по-малка консумация на енергия и по-малка дължина на платките. За съжаление този дизайн не е задължителен и някои производители на видеоплатки продължават да използват досегашните си разработки за 9800GTX+ с нови надписи „GTS250” върху кутиите. Производителността на GTS250 в общия случай е малко по-ниска от Radeon HD4870 със същия обем памет (1GB), но пък GTS250 е и малко по-евтин.

Останалите „нови” продукти са достъпни само за големите производители на персонални компютри (OEM – Original Equipment Manufacturer). Те могат да си поръчват GeForce G100, GT120, GT130 и GTS150. GeForce G100 използва 512 МВ памет и е идентичен с PCIe 2.0 версията на 8400GS. GeForce GT120 използва 512 МВ памет и е аналог на 9500GT, но работи с по-ниски честоти на паметта (500 MHz/ 1000 DDR вместо 800 MHz/ 1600 DDR) и модулите на GPU-то извън Shader процесорите (500 MHz вместо 550 MHz). Самите Shader процесори работят на 1400 MHz и при GT120 и при 9500GT. GeForce GTS150 представлява аналог на GTS250/9800GTX+ и се отличава от тях единствено по малко по-бавната памет (1000 MHz/ 2000 DDR вместо 1100 MHz/ 2200 DDR).

GeForce GT130 е единственият продукт, който няма аналог сред досегашните GF8/9. GT130 предоставя 48 Shader процесора (1250MHz), 24 текстуриращи и 12 финализиращи модула (500 MHz) и 192-битов интерфейс към 768 МВ GDDR3 памет (500 MHz/ 1000 DDR). nVidia се възползват максимално от модулността на чиповете си и предлагат всевъзможни комбинации от продукти с частично дезактивирани модули като по този начин оползотворяват максимален брой от изработените силициеви пластини (т.е. тези, които имат дефект в някой модул или не издържат на необходимата тактова честота, биват пренасочени към подходящ „междинен” модел, в който проблемните модули не се използват и се дезактивират) и от наличните на склад по-стари чипове (65nm G9x).

За ъпгрейд на компютри, които нямат PCIe x16 слот Sparkle предлагат low-profile PCI платки с GF9400GT и GF9500GT (подходящи са за Mini-ITX дъна с Atom процесори и i945GSE чипсет, които имат само PCI слот заради ограниченията на Intel), а Albatron – low-profile PCIe x1 GF9500GT.

Автор: Стоян Спахиев