Видеокарты последнего поколения — прорыв nVidia GeForce 6 и ATI Radeon X при близком рассмотрении
9 июня 2005
Рубрика: Обзоры и мнения.
Автор: Александр Павлов.
pic

Любой пользователь ПК, который хоть иногда играет в современные компьютерные игры, знает, что комфортность в игровых приложениях напрямую зависит от производительности графического адаптера. В то же время при приобретении ПК, когда встает вопрос о выборе видеокарты, зачастую у пользователя возникают сомнения на этот счет, и противоречивые соображения начинают подтачивать решимость приобрести производительный графический адаптер. «Играет же сосед в «Need For Speed Underground» на своем компьютере с видеокартой GeForce FX 5200 и на «тормоза» вроде не жалуется.., — рассуждает покупатель, — значит, нормальная «видяха», и не буду я переплачивать лишние пятьдесят тысяч». Так ПК, который изначально планировался для игр, становится больше похожим на офисную машину.

Напомню, что всегда нужно четко понимать, какие задачи будут выполняться на данном ПК, и, исходя из этого, конфигурировать компьютер — только так можно достигнуть наилучшего соотношения цена/производительность. Это касается и графических адаптеров. В этом материале мы попытаемся разобраться в современных графических ускорителях, понять, что они собой представляют. Речь пойдет об ускорителях GeForce 6 series от nVidia и Radeon X series от ATI.
Летом 2004 года на рынке графических ускорителей выпал дубль — два главных конкурента в этом секторе практически одновременно выпустили чипы нового поколения. Калифорнийская компания nVidia представила графический чип с кодовым названием NV40, а канадская фирма ATI чип с кодовым названием R420. «В народе» эти чипы известны под названиями nVidia GeForce 6800 и ATI Radeon X800 соответственно. На фоне довольно скромного в отношении прироста производительности предыдущего поколения выход новых графических процессоров оказался настоящим прорывом. Производительность увеличилась почти в два раза по сравнению с предшествующим поколением, и впервые был взят рубеж производительности в 10000 «попугаев» по результатам 3DMark 2003. Потенциала новинок с лихвой хватает для самых современных 3D-игр даже при максимальных настройках качества изображения.

pic

Выделить лидера из двух кампаний (nVidia или ATI) не представляется возможным, это все равно, что сравнивать два стакана воды.
Прежде чем давать оценку той или иной видеокарте, нужно разобраться, что вообще она из себя представляет. В принципе, видеокарта — это целая графическая подсистема персонального компьютера, состоящая из платы, процессора, памяти и системы охлаждения. Можно сказать, что видеокарта — это отдельная система, структурно схожая с платформой ПК, но обрабатывающая только графические данные. Процессором в данном случае является GPU (Graphic Processor Unit). Графические процессоры отнюдь не являются более простыми полупроводниковыми устройствами по сравнению с привычными для нас центральными микропроцессорами. Современный GPU хоть и выпускается по не столь тонкому технологическому процессу 110/130 нм (крупнейшие производители CPU, компании Intel, AMD и другие уже сравнительно давно используют технологию производства 90 нм, и не за горами освоение техпроцесса 65 нм), зато по количеству транзисторов на кристалле явно не уступает центральным процессорам. Все видеокарты не имеют никаких разъемов и слотов для графических чипов, GPU попросту распаивается прямо на печатной плате.

pic

Разумеется, сегодня видеокарты не обходятся без систем охлаждения. Наибольшее количество тепла выделяет GPU, но нередко и высокопроизводительная память тоже требует дополнительного охлаждения. Чипам памяти достаточно пассивного охлаждения (отвод тепла только радиатором), а вот топовые графические процессоры требуют качественного отвода тепла, поскольку выделяют они его немало. Обычно применяются классические кулеры, но все чаще используются радиаторы с теплотрубками, и даже жидкостные системы. Многие компании, специализирующиеся на производстве систем охлаждения для настольных компьютеров, расширили перечень предлагаемых решений за счет систем охлаждения для видеокарт.

Как и материнская плата, плата видеокарты имеет свою постоянную память, содержащую BIOS (Base Input Output System). И так же как и на материнской плате, его можно прошивать, то есть заменять одну версию BIOS в ПЗУ видеокарты другой. Питание платы может осуществляться двумя способами: через интерфейсную шину или через дополнительный разъем напрямую от системного блока питания. Второй вариант является следствием того, что карта потребляет большую мощность, и питания через интерфейсную шину недостаточно. На практике такая ситуация стала «бедой» топовых графических адаптеров, так как при приобретении дорогой и производительной видеокарты пользователь вынужден менять блок питания на более мощный.

Для подключения видеокарты к материнской плате и для передачи данных между графическим адаптером и системной платой в настоящее время используют два протокола шин. Первая шина — AGP, работает на исходной тактовой частоте 66 МГц, которая для увеличения пропускной способности умножается на коэффициенты. Максимальная кратность шины AGP — 8х, то есть результирующая частота составляет 533 МГц. Максимальная пропускная способность достигает 2133 Мб/с. Интерфейс AGP (Accelerated Graphic Port) разрабатывался на основе интерфейса PCI. Он удерживает позиции уже почти десяток лет. Никогда конкурентная борьба между производителями, внедрение новых технологий на графических акселераторах не достигали такого накала, как в эпоху AGP. Но ничто не вечно, и вот уже устаревшая шина AGP сдает свои позиции. Материнские платы и видеокарты AGP 4x уже почти не выпускаются, так как современным поколениям адаптеров недостаточно пропускной способности порта AGP 4x. Шина AGP 8x, хоть и удерживает еще первое место среди выпускаемых видеоадаптеров, но доля ее стремительно уменьшается.

pic

Сегодня подавляющее большинство настольных систем в мире имеет именно интерфейс AGP, но его развитие исчерпало себя, и на смену ему приходит новая шина PCI Express (PCI-E), в которой пропускная способность масштабируется путем увеличения числа каналов. Скорость передачи данных через интерфейс PCI-E 16х составляет 4 Гб/с. Повышена максимальная потребляемая мощность через шину PCI Express до 75 Вт. Вообще шина PCI-E весьма гибкая, и все ее каналы можно «тасовать», как игральные карты. Например, можно развести два «пучка» по 8 каналов для двух слотов под видеокарты. Таким образом, можно установить на плату две видеокарты с интерфейсом PCI-E. Собственно говоря, nVidia даже представила технологию параллельного использования двух PCI-E видеокарт, и мы вернемся к этой технологии, но несколько ниже.

И, наконец, видеокарта имеет свою подсистему оперативной памяти. Чипы памяти распаяны прямо на видеоплате, а выглядят они так же, как и чипы на обычных модулях оперативной памяти DIMM. Новое поколение графических ускорителей поддерживает высокопроизводительную память стандарта GDDR3, а время выборки для топ-моделей составляет всего 2 наносекунды. Память на видеокартах, в принципе, используется для тех же целей, что и на материнской плате — для кэширования и хранения данных, с которыми непосредственно работает процессор, в данном случае графический.

pic

Раз уж мы коснулись вопроса о видеопамяти, не могу не отметить, что утверждение «чем больше памяти, тем лучше» не всегда верно и далеко не так однозначно, как кажется. То, чем привлекают неискушенного пользователя, имеет и обратную сторону медали. Помимо объема памяти для графического ускорителя большое значение имеют ширина шины памяти и, конечно же, тактовая частота. Дело в том, что одним из показателей, наиболее объективно отражающих производительность памяти, является пропускная способность, которая считается по формуле «ширина шины x тактовую частоту памяти». В итоге видеокарта с более мощным чипом и быстрой памятью зачастую может оказаться производительней карты с менее мощным чипом и большим объемом медленной памяти.

Как видите, видеокарта является системой, состоящей из различных функциональных блоков, а из этого следует, что она имеет различные параметры, которые в совокупности влияют на производительность. Тем не менее самым важным элементом, «сердцем», а точнее выразиться «мозгом» графической подсистемы является GPU.
Сегодня мы имеем два новых семейства графических ускорителей: nVidia GeForce 6 и ATI Radeon X. Не вдаваясь в длительное описание технических параметров новинок, которые, по большому счету, новинками уже давно не являются, так как были запущены в массовое производство еще в конце лета прошлого года (для ташкентских пользователей новые карты стали актуальны совсем недавно ввиду высокой стоимости), привожу все их особенности в таблице.

pic

Далее оцениваем «девайсы». Речь пойдет о дорогих топовых ускорителях hi-end сектора, так как именно они являются образчиком прогресса в области видеоадаптеров, а их младшие братья среднего и начального уровней являются ничем иным, как урезанными клонами флагманов. По сути, «урезанность» заключается в уменьшенном количестве конвейеров, пониженных частотах ядра и памяти, «узкой» шине памяти и, наконец, использовании более медленной графической памяти. Начнем с графического ускорителя нового поколения GeForce 6800 Ultra от калифорнийской компании nVidia.

Первое, что бросается в глаза при рассмотрении nVidia GeForce 6800 Ultra — количество транзисторов внутри графического чипа. 220 миллионов транзисторов — впечатляющее количество. Это почти в два раза больше, чем в GeForce FX, предшественнике GeForce 6. В этом отношении даже сверхпроизводительные модели процессоров Pentium 4 Extrim Edition от Intel со своими 170 миллионами транзисторов на кристалле выглядят не так грозно. Отсюда и проблемы с большим энергопотреблением — 110 Вт. Частота чипа составляет всего лишь 425 МГц, что говорит о проблемах с технологическим процессом. С другой стороны, сравнительно небольшая тактовая частота может предполагать запас для увеличения частоты на следующих моделях. Но пока у производителя графических процессоров nVidia не будет отточена технология производства 110 нм, о существенном приросте тактовой частоты можно и не мечтать, так как тепловыделение зашкалит за все разумные пределы. Кстати, о тепловыделении и энергопотреблении чипа nVidia. Первые сэмплы видеокарт на основе чипа NV40 помимо питания от системной платы через интерфейсный порт AGP требовали дополнительного питания аж по двум разделенным каналам и, соответственно, имели два дополнительных разъема питания. А для стабильной работы системы с такой видеокартой требовался блок питания мощностью не менее 480 Вт, который стоит немало, да и продается не везде. Версии GeForce 6800 Ultra с интерфейсом PCI-Express имеют один дополнительный разъем питания за счет того, что новая шина поддерживает устройства, потребляющие мощность до 75 Вт. В любом случае флагманские карты на основе чипов nVidia представляют собой массивные устройства с крупными и мощными системами охлаждения, занимающими место двух слотов на материнской плате — весьма прожорливые «монстры».

pic

Наиболее интересен факт увеличения числа конвейеров в GPU. Новые чипы имеют 16 пиксельных и 6 вершинных конвейеров, что ровно в два раза больше, чем у предыдущего поколения. Обработке графическим процессором подлежат практически однородные массивы данных. Более того, многие данные могут обрабатываться одновременно, так как идут в нескольких абсолютно идентичных по структуре потоках, которые не зависят друг от друга. Поэтому производительность графических процессоров можно увеличивать не за счет наращивания тактовых частот чипов, а за счет увеличения количества конвейеров. Этот шаг вполне оправдан, так как на каждом этапе обработки акселератором 3D-изображения GPU проделывает похожие друг на друга действия, которые довольно легко предсказываются. К примеру, для обработки вершин треугольников требуется три независимых конвейера. Так как вершины рассчитываются независимо, то они могут рассчитываться параллельно, а блок контроля над конвейерами может правильно распределять задачи между ними в зависимости от исполняемой программы вершинного шейдера. То же самое происходит и с пиксельными операциями, только, в отличие от вершинных конвейеров, пиксельная часть процесса подготовки изображения требует больших ресурсов, отчасти в силу более широкого применения, поэтому количество пиксельных конвейеров в графическом чипе заметно больше. Именно за счет увеличения числа пиксельных и вершинных конвейеров в два раза так ощутимо увеличилась производительность относительно предыдущего поколения графических акселераторов.

Новый чип nVidia получил поддержку памяти в виде четырехканального контроллера памяти GDDR3 SDRAM, а также 256-битную шину памяти (64 bit x 4). Стандарт GDDR3 — это абсолютно новая архитектура чипов графической памяти, разработанная и утвержденная JEDEC (Joint Electronic Devices Engineering Council — Совет по совместной разработке электронных компонентов). Основным разработчиком нового стандарта графической памяти оказалась компания ATI. Основными достоинствами GDDR3 стали более простая архитектура, улучшенная синхронизация и существенно пониженная потребляемая мощность, а следовательно, и тепловыделение, при полной совместимости со стандартами GDDR и GDDR2. Чипы графической памяти нового поколения выпускаются в упаковках типа BGA, отчего имеют пока еще сравнительно высокую цену. Видеокарты с графическими процессорами GeForce 6800 Ultra оснащены такой памятью объемом 256 Мб. Тактовая частота составляет 550МГц (эффективная 1100 МГц по принципу DDR). Чтобы не возвращаться более к вопросу о памяти, замечу, что графические адаптеры на базе ATI Radeon X850XT имеют на борту такой же объем точно такой же памяти GDDR3, а контроллер также обеспечивает работу шины с разрядностью 256 бит.

pic

Достоинствами NV40 являются появившаяся в нем полная аппаратная поддержка DirectX 9.0c, а также поддержка новой модели программируемых шейдеров Shader Model 3.0, что позволяет разработчикам игр реализовывать массу новых функций. Данный уровень функциональности находится на пределе возможностей современных API (Application Programming Interface — программный интерфейс приложения). Помимо таких кардинальных нововведений новый графический ускоритель обзавелся поддержкой 16-кратной анизотропной фильтрации на базе технологии IntelliSample 3.0 от nVidia, которая раньше была только у карт на базе графических процессоров ATI, и поддержкой так называемых карт замещения (Displacement Mapping). Также появилась функция по улучшенной работе с тенями UltraShadow II. Однако nVidia не остановилась на этом и представила еще более интересную новую технологию — SLI.

SLI (Scalable Link Interface) позволяет использовать две PCI Express видеокарты с графическим ядром от nVidia в одной системе, то есть на одной материнской плате. Карты соединяются специальным коннектором и работают как одна. Грубо говоря, при расчете сцена разбивается на две части, одной из которых является верх сцены, а другой, соответственно, ее нижняя часть, и нагрузка по ускорителям разбивается таким образом, чтобы наиболее эффективно задействовать каждую из карт, и динамически варьируется в зависимости от изменения рассчитываемой сцены. Производительность, разумеется, вырастет не в два раза, но все же ощутимо, и прирост составит 30-90%. Во многом это зависит от того, насколько игровое приложение адаптировано под распараллеливание SLI. На самом деле SLI новой технологией не является. Помните, в 1998 году такой прием был предложен для увеличения производительности видеокарт Voodoo 2 от 3Dfx. Чтобы реализовать SLI, нужно запастись деньгами — удовольствие дорогое. Помимо двух топовых видеокарт на основе GeForce 6800 или 6600 нужно купить еще материнскую плату с поддержкой технологии SLI за 200 долларов и мощный и дорогой блок питания. Естественно, технология SLI не пошла «в массы», и неизвестно, получит ли вообще широкое распространение, но по производительности она возводит решения от nVidia на недосягаемый для конкурента уровень. А это очень важно в конкурентной борьбе — иметь возможность сказать, что «мы впереди колонны».

pic

Перейдем к графическому ускорителю от ATI. Графический процессор Radeon X850XT состоит из заметно меньшего числа транзисторов на кристалле — 160 миллионов, что, впрочем, не мешает ему демонстрировать отличную производительность. Такая разница в размерах чипов обусловлена различием архитектур ATI и nVidia. Тактовая частота графического ускорителя составляет 520 МГц. При этом потребляемая мощность и тепловыделение не так высоки благодаря меньшему числу транзисторов на кристалле, техпроцессу с использованием диэлектрика Low-k. К тому же все энергосберегающие технологии ATI для мобильных решений внедрены и на обычных графических процессорах ATI — конвейеры просто отключаются в случае их простоя. В результате системы охлаждения, да и сами карты выглядят хоть и внушительно, но все же скромнее, чем продукты на базе чипов nVidia. Тем не менее дополнительное питание и мощный блок питания не остались в стороне. Память графических адаптеров Radeon X850XT работает на частоте 1080 МГц.
Число пиксельных и вершинных конвейеров в Radeon X850XT совпадает с числом конвейеров в GeForce 6800 Ultra 16 и 6 соответственно. Шесть блоков вершинных программ (вместо старых четырех) теоретически готовят 750 миллионов полигонов в секунду, для сравнения — NV40 демонстрирует 600 миллионов полигонов в секунду за счет меньшей частоты работы чипа. А 16 пиксельных конвейеров (вместо старых восьми) способны обрабатывать параллельно до 80 шейдерных инструкций за такт с производительностью 192GigaFLOP и c теоретическим филрейтом (скорость заполнения) более чем 8,8 гигапикселей в секунду. Конвейер пиксельного шейдера состоит из двух векторных и двух скалярных ALU. Плюс один адресный ALU и специальный блок F-Buffer, отвечающий за обработку длинных шейдеров OpenGL. Переработан модуль SmoothVision, отвечающий за полноэкранное сглаживание — появилась возможность реализации темпорального антиалиасинга. Эта технология основана на быстрой смене четных и нечетных кадров с наложением разных масок антиалиасинга для каждого из них. То есть система темпорального антиалиасинга может по праву считаться бесплатным удвоением качества сглаживания без потерь в производительности. По большому счету, больше существенных архитектурных изменений новый чип R420 со времен R360 не претерпел.

В отношении поддержки новых технологий Radeon X850XT выглядит не в таком радужном свете, как GeForce 6800 — чип нового поколения от ATI не получил поддержки шейдеров версии 3.0 и новых версий API, которые позволяют их использовать: DirectX 9.0c и OpenGL 1.5. С другой стороны, трудно сказать, оправдан ли сегодня переход на использование Shader Model 3.0. Ситуация осложняется тем, что еще не все разработчики игр перешли на использование второй версии шейдеров, как появилась третья. Фактически это означает, что программистам для обеспечения полной функциональности собственных продуктов придется писать три версии игры. Но понемногу шейдеры 3-й версии получают распространение, и хотя происходит этот процесс медленно, факт остается фактом — Radeon X series их не поддерживает. Особого внимания заслуживает новая технология сжатия карт нормалей 3Dc от ATI, с помощью которой можно добиться значительно большей четкости изображения.

Итак, общая картина с участием графических ускорителей последнего поколения в основных чертах обрисована. Рывок производительности огромен в обоих случаях. Кстати, это является фактом и для среднего и низшего ценовых диапазонов. Топовые графические акселераторы предыдущего поколения остались далеко позади и переместились в средний эшелон, а если учесть новые технологии, присутствующие в новых ускорителях, то еще ниже. Производительность nVidia GeForce 6800 Ultra и ATI Radeon X850XT находится приблизительно на одном уровне. Учитывать преимущество в несколько баллов (из тысяч) и несколько десятых долей fps (frames per second — кадров в секунду) в пользу Radeon X850XT смысла не имеет. Помните стаканы с водой? Представьте, что в одном 250 г воды, а в другом — 249. Это же не означает, что из какого-либо стакана можно больше утолить жажду.

При довольно низком энергопотреблении, нетребовательности к питанию и высокой производительности Radeon X800 не может похвастаться всеми теми технологиями, коими располагают чипы nVidia — Radeon X так и не получил поддержку шейдеров 3-й версии. В то же самое время nVidia не может похвастаться столь выгодными энергетическими и тепловыми характеристиками, как ATI, но технологическое лидерство nVidia так и осталось непоколебимым. В hi-end секторе выбор сделать сложно. Здесь основными критериями станут цена и личные предпочтения.
В любом случае видеокарты на основе графических процессоров ATI Radeon 9xxx серии и nVidia GeForce FX серии потеряли свою актуальность и не способны удовлетворить требования ультрасовременных 3D-игр. На прилавках еще присутствует масса моделей этих серий, но покупать их, несмотря на привлекательные цены, особого смысла уже нет, а видеокарты с чипами ATI Radeon X и nVidia GeForce 6 станут удачным выбором с запасом на будущее.

pic
Orphus system
В Telegram
В Одноклассники
ВКонтакте