Видеокарты. Видеокарты Тестовая конфигурация, инструментарий и методика тестирования

Трудности с освоением нового 28-нм техпроцесса немного сбавили темпы гонки между AMD и NVIDIA. Год назад были представлены флагманы прошлого поколения, и после довольно длительного периода доминирования AMD на рынке графических ускорителей их конкурент, наконец-то, смог уверенно потеснить «красных», выпустив GeForce GTX 580 . И этот акселератор всерьез и надолго занял место лидера среди однопроцессорных решений. Но так было до недавнего момента. С анонсом Radeon HD 7970 компания AMD снова вырывается вперед — новый техпроцесс и новый уровень производительности дают шанс вернуть обратно пальму первенства.

Архитектура GCN и графический процессор Tahiti

Последние несколько лет архитектура графических процессоров AMD серьезно не менялась. Но прогресс диктует свои условия. Функциональность и сфера применения графических процессоров расширяются. Все более актуальными становятся неграфические вычисления, и технология GPGPU становится все более востребованной. Лидером в этой области является NVIDIA, которая всячески популяризовала свою платформу CUDA и с недавнего времени даже открыла доступ к исходному коду компилятора. Архитектура GeForce уже давно идет по пути унификации. И вслед за конкурентом, AMD переходит от VLIW к более гибкой и универсальной архитектуре под названием Graphics Core Next (GCN). Старая архитектура в первую очередь была ориентирована на графические расчеты, новая — на смешанные гетерогенные вычисления для одновременной обработки совместно с CPU. И это является одной из ступенек для дальнейшего развития гибридных процессоров Fusion.

В основе старой архитектуры лежали блоки SIMD Engine по 16 потоковых процессоров, которые выполняли одну VLIW-инструкцию над разными блоками данных. При неграфических вычислениях основной проблемой была полная загрузка SIMD-блока. Новая архитектура построена на более универсальных блоках GCN Compute Unit (CU), которые могут гибко распределять нагрузку.


Каждый CU разбит на четыре векторных модуля по 16 ALU и имеет свой скалярный блок для контроля и управления потоками, а также выполнения отдельных операций, не являющихся частью основного массива обрабатываемых данных. У CU имеется локальная память объемом 64 КБ, кэш L1 на 16 КБ и свои блоки выборки и фильтрации текстур. Наличие внутреннего планировщика у такого GCN-блока позволяет им обрабатывать разные потоки и легко переключаться на другие задачи, обходясь без единого внешнего планировщика.

У каждых четырех модулей CU имеется общее хранилище 32 КБ для данных и кэш 16 КБ для инструкций. Общий объем кэша второго уровня в два раза выше, чем у Cayman, и достигает 768 КБ. Пропускная способность шин кэша L1 и L2 позволяет передавать 64 байта за такт. Общая пропускная способность для кэш-памяти первого уровня достигает 2 ТБ/с, для второго — 700 ГБ/с, что в два раза больше возможностей старого Cayman.


Radeon предыдущих серий сильно уступали конкурентам из линейки GeForce при работе с тесселяцией. Поэтому значительному улучшению подверглись блоки обработки геометрии. Их по-прежнему два. Но производительность блока тесселяции значительно повысилась, а сам он получил принадлежность аж к 9 поколению. В определенных режимах обещано ускорение производительности при тесселяции до четырех раз. Но это в синтетике, в реальных играх разница будет значительно меньше. AMD говорит о приросте от 50 до 130% в сравнении с Radeon HD 6900 , что тоже немало.


В неграфических задачах прирост обещают не менее внушительный — от 1,4 до 4 раз в определенных расчетах и задачах.

Появилась поддержка алгоритма Ptex (Per-face texture mapping), который упрощает тесселяцию некоторых объектов. Вместо совмещения целой текстуры с моделью на каждый полигон накладывается отдельная текстура. А технология Partially Resident Textures позволит использовать видеопамять как кэш, в который по мере надобности будут подгружаться текстуры.

Новое поколение графических процессоров AMD совместимо с DirectX 11.1. К числу нововведений также относится поддержка API DirectCompute 11.1, OpenCL 1.2 и C++ AMP.

На базе новой архитектуры планируется в начале следующего года выпустить три линейки видеокарт. Флагманский GPU под кодовым именем Tahiti даст жизнь картам серии Radeon HD 7900, на базе Pitcairn увидят свет Radeon HD 7800, а Verde придет в средний класс с продуктами линейки Radeon HD 7700.

Блок-схема топового Tahiti приведена ниже.


Этот графический процессор включает 32 GCN Compute Unit, каждый из которых насчитывает 64 ALU. А всего получается 2048 штук, что на треть больше, чем у Cayman. Общее количество текстурных блоков достигает 128 штук (96 у предшественника). Не выросло лишь число ROP — их по-прежнему 32. Шесть 64-битных контроллеров обеспечивают связь с памятью по 384-битной шине — прямо как у топового GeForce GTX 580 от NVIDIA. В таком полнофункциональном варианте выпускается Radeon HD 7970. У его младшего брата в лице Radeon HD 7950 часть GCN-блоков будет отключена. GPU у старшей карты работает на 925 МГц, что лишь на 45 МГц выше частоты графического процессора Radeon HD 6970. Память GDDR5 функционирует на 5500 МГц. И тут вообще никакой разницы с предшественником. Правда, у последнего шина 256 бит, так что его пропускная способность памяти заметно ниже. Объем видеобуфера вырос с двух гигабайт до трех.
Видеоадаптер Radeon HD 7970 Radeon HD 6970 Radeon HD 5870
Ядро Tahiti Cayman Cypress
Архитектура GNC VLIW4 VLIW5
4312 2640 2154
Техпроцесс, нм 28 40 40
Площадь ядра, кв. мм 365 389 334
2048 1536 1600
Количество текстурных блоков 128 96 82
Количество блоков рендеринга 32 32 32
Частота ядра, МГц 925 880 850
Шина памяти, бит 384 256 256
Тип памяти GDDR5 GDDR5 GDDR5
Частота памяти, МГц 5500 5500 4800
Объём памяти, МБ 3072 2048 1024
11.1 11 11
Интерфейс PCI-E 3.0 PCI-E 2.1 PCI-E 2.1
Заявленная потребляемая мощность в простое, Вт 3 20 27
250 250 188

Из-за кардинально переработанной архитектурой новый GPU стал намного сложнее и более громоздким. В итоге он даже обогнал GF110 по количеству транзисторов. Но благодаря более тонкому техпроцессу кристалл Tahiti по размерам не больше Cayman, и даже чуть меньше. Максимальный уровень энергопотребления тоже не вырос. И достигнуть этого помог не только новый технологический процесс производства, но и усовершенствованная технология AMD PowerTune. Процессор обладает еще более гибкой системой управления напряжениями и отключает функциональные блоки при простое видеокарты. По показателям энергопотребления в простое Radeon HD 7970 просто рекордсмен — всего 3 Вт! Технология PowerTune контролирует уровень TDP, регулируя рабочие частоты так, чтобы не превысит лимит. Сверхбыстрое реагирование возможно благодаря датчикам, отслеживающим загрузку всех блоков. Конечно, в реальных играх снижаться частоты не будут, а вот в Furmark такое возможно. Нельзя не вспомнить, что подобного рода «защита» от программ стресс-тестирования реализована и в последних видеокартах GeForce. PowerTune — технология аппаратная, но пользователь может корректировать максимальный уровень мощности с помощью соответствующего параметра в Catalyst Control Center.

В режиме длительного простоя при отключенном дисплее карта может полностью выключить вентилятор. Если в системе несколько видеокарт Radeon, которые объединены в CrossFireX, то в простом 2D-режиме простаивающие карты переводятся в самый экономичный режим и отключают вентилятор.


Radeon HD 7970 и все последующие графические решения AMD обрели поддержку высокопроизводительной шины PCI Express 3.0. Хотя сомнительно, что для игровой карты даже такого уровня нужна быстрая шина. А вот для неграфических расчетов это будет более актуальным. Сохранена аппаратная совместимость со старыми стандартами PCI-E, так что никаких проблем с использованием новых видеоадаптеров на относительно старых системных платах быть не должно.

Получила развитие и технология AMD Eyefinity. Вместе с индексом 2.0 появилась поддержка HD3D для мультимониторных конфигураций. Radeon HD 7970 — первая карта AMD, которая позволяет выводить стереоизображение на три монитора. Специально для этого режима она обзавелась поддержкой интерфейса HDMI 1.4a frame packing, который (в отличие от простого HDMI 1.4a) позволяет передавать картинку в Full HD с частотой 60 Гц на глаз. Добавилась поддержка новых разрешений и конфигураций. Как и ранее, подключить к карте можно шесть мониторов. С помощью специального хаба к одному интерфейсу Display Port 1.2 возможно подключить три устройства. Правда, такие хабы появятся в продаже значительно позже.

Блок UVD в GPU Tahiti обеспечивает аппаратное декодирование данных в форматах MPEG-2/MPEG-4 (DivX), VC-1 и H.264. Для аппаратного кодирования видео появился специальный блок VCE, который может работать как совместно с потоковыми процессорами, так и сам обрабатывать видео. Новая технология AMD Steady Video позволит улучшить видео плохого качества и убрать дрожание камеры.

В числе уникальных достоинств Radeon HD 7970 — поддержка Ultra High Resolution. Тут новинка снова в роли первопроходца, хотя эра UHDTV пока еще кажется очень далекой.

Новичок по своим размерам не отличается от референсных Radeon HD 6950/6970.


Представители шеститысячной серии Radeon не отличались изысканным дизайном. Своими строгими угловатыми формами они напоминали кирпич. У Radeon HD 7970 более оригинальный внешний вид — черный округлый кожух с красными вставками.


Смотрится очень симпатично. Глянцевая поверхность пластикового кожуха придает лоска.


Сбоку расположены два разъема питания — один на шесть контактов, второй на восемь. AMD решила продолжить традицию использования двойного BIOS, которая взяла начало с Radeon HD 6950/6970. И возле пары разъемов CrossFire имеется соответствующий переключатель. Это весьма удобно для экспериментов с разгоном. Тем более, что одна микросхема недоступна для перепрошивки, и в случае какого-то сбоя всегда можно вернуться к рабочей конфигурации.

Обратная сторона платы уже не закрыта цельной пластиной.


Набор разъемов на задней панели включает пару Display Port 1.2, один HDMI 1.4a и привычный DVI.


За охлаждение видеокарты отвечает «турбина» стандартной конструкции. Это почти полная копия кулера Radeon HD 6970 .


Массивная испарительная камера с рядом алюминиевых пластин. Основание кулера — большая алюминиевая пластина, которая отводит тепло от микросхем памяти и силовых элементов. Вентилятор стал чуть больше, диаметр его увеличился на 5 мм, да и сами лопасти более широкие. Так что эффективность системы охлаждения по сравнению с предшественником тоже должна немного улучшиться.


Оценить размеры радиатора можно по нижней фотографии, где видеокарта изображена без пластикового кожуха. Длина платы 27 сантиметров.


Дизайн самой платы напоминает Radeon HD 6970 второй ревизии с шестифазной схемой питания графического процессора. Только используются другие компоненты.


Впервые на референсном решении мы видим «мосфеты» в корпусе DirectFET, которые обладают самыми лучшими характеристиками в сравнении с другими полевыми транзисторами. Решение более дорогое, но и более надежное. И до появления Radeon HD 7970 такие компоненты использовались только MSI в своих топовых видеокартах оверклокерской серии Lighting .


Системой питания управляет контроллер CHiL CHL8228G. Точно такой же использовался у Cayman. Так что после обновления MSI Afterburner можно рассчитывать на полноценную поддержку софтвольтмода.


Вокруг кристалла GPU имеется большая рамка, которая надежно защищает его от сколов. Хотя и сама конструкция кулера исключает любую возможность его перекоса. На процессоре нет никакой маркировки. Все данные нанесены на рамку.


Три гигабайта видеопамяти набраны 12 микросхемами Hynix H5GQ2H24MFR R0C, которые рассчитаны на частоту 6 ГГц.

Последняя версия GPU-Z правильно определяет все параметры видеокарты. Графический процессор работает на 925 МГц, память — на 5500 МГц.


Отслеживать температуру ядра можно с помощью GPU-Z или beta-версий MSI Afterburner 2.2.0. Последняя утилита не позволяет корректно менять частоты, но регулирует обороты вентилятора и поддерживает все функции мониторинга.


Нагрузив видеокарту демо Ambush из Crysis Warhead Benchmarking Tool (на максимальных настройках качества изображения в разрешении 1920x1080 при AA8x) мы сумели прогреть GPU всего лишь до 75 °C в открытом корпусе при 24 градусах в помещении. И при такой умеренной температуре вентилятор раскручивался только до 2200 об/мин, так что уровень шума был невысокий. Отличный результат! Ведь за последние несколько лет пользователи привыкли к тому, что старшие графические ускорители горячие или громкие, а то сразу и те и другие одновременно.

Конечно, Crysis уже не сможет прогреть такую видеокарту по полной. Но даже после часа тестов в DirectX 11 температура не поднялась выше 76 °C. Все вроде отлично, и ничто не греется, однако в какой-то момент Radeon HD 7970 начал «радовать» нас сверхнизкими результатами и артефактами в играх. Все решилось довольно просто. После того, как карта остыла, мы загрузились и сразу же подняли обороты в MSI Afterburner до 60%. Это позволило нормально пройти все тесты заново. Причина такого поведения видеокарты не совсем ясна. Возможно, дело в «сыром» BIOS или программном обеспечении, из-за чего некорректно сработала система PowerTune, переводя карту в более медленный режим. Но это один из первых инженерных образцов видеокарты, первый BIOS и первый видеодрайвер. До официального старта продаж еще полторы недели и этого более чем достаточно для устранения каких-то огрехов в программном обеспечении. Так что потенциальным покупателям новинок бояться ничего не стоит.

Что же касается разгона, то пока весь инструментарий для этих целей ограничен возможностями Catalyst Control Center. Хотя ограничения там не такие уж и маленькие. AMD Overdrive позволяет поднимать частоту ядра до 1125 МГц, а памяти до 6300 МГц. Такой «запас» намекает на то, что 1 ГГц Tahiti должен взять с полпинка.


Так это или нет, мы выясним в следующей части статьи. В данном обзоре сосредоточимся на производительности нового Radeon в номинальном режиме.
Характеристики видеокарт

В наше тестирование мы включили такие видеокарты:

  • Radeon HD 6970 (ASUS EAH6970 DCII/2DI4S/2GD5);
  • Radeon HD 6990 (PowerColor AX6990 4GBD5-M4D);
  • GeForce GTX 580 (Zotac GeForce GTX 580 AMP! Edition на пониженных до стандарта частотах).
Видеокарта ASUS идет с заводским разгоном 10 МГц по ядру. Но это настолько мизерная разница со стандартной частотой, что для тестов мы не стали ее снижать до 880 МГц.
Видеоадаптер Radeon HD 6990 Radeon HD 7970 ASUS Radeon HD 6970 GeForce GTX 580
Ядро Antilles Tahiti Cayman XT GF110
Количество транзисторов, млн. шт 2640x2 4312 2640 3000
Техпроцесс, нм 40 28 40 40
Площадь ядра, кв. мм 389x2 365 389 520
Количество потоковых процессоров 1536x2 2048 1536 512
Количество текстурных блоков 96x2 128 96 64
Количество блоков рендеринга 32x2 32 32 48
Частота ядра, МГц 800 (880*) 925 880 772
Частота шейдерного домена, МГц 800 (880*) 925 880 1544
Шина памяти, бит 256x2 384 256 384
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5
Частота памяти, МГц 5000 5500 5500 4008
Объём памяти, МБ 2048x2 3072 2048 1536
Поддерживаемая версия DirectX 11 11.1 11 11
Интерфейс PCI-E 2.1 PCI-E 3.0 PCI-E 2.1 PCI-E 2.0
Заявленная максимальная потребляемая мощность, Вт 350—375 250 250—190 244

Тестовый стенд

Конфигурация тестового стенда следующая:

  • процессор: Core i7-975 EE (3,2@4,15 ГГц, BCLK 173 МГц);
  • кулер: Thermalright Venomous X;
  • материнская плата: Gigabyte GA-X58A-UD3R (Intel X58 Express);
  • память: G.Skill F3-12800CL8T-6GBRM (3x2GB, DDR3-1600@1730 МГц, 8-8-8-24-1T);
  • жесткий диск: Hitachi HDS721010CLA332 (1 ТБ, SATA2, 7200 об/мин);
  • блок питания: FSP FX700-GLN (700 Вт);
  • операционная система: Windows 7 Ultimate x64;
  • драйвер Radeon: ATI Catalyst 11.12;
  • драйвер GeForce: NVIDIA GeForce 285.62.
В операционной системе были отключены User Account Control, Superfetch, Windows Defender и визуальные эффекты интерфейса. Настройки драйверов стандартные, без изменений.

Результаты тестирования




В 3DMark 11 новый Radeon обходит предшественника на 41—45% и не дотягивает до двухчипового видеоадаптера 27—31%. GeForce GTX 580 проигрывает новичку где-то 26—29%.


Два пятикратных прогона Ambush из Crysis Warhead Benchmarking Tool. Настройки графики максимальные (Enthusiast), сглаживание AA8x.


В данной игре преимущество Radeon HD 7970 над однопроцессорными моделями намного скромнее. В этот раз ему даже не удается обогнать GeForce GTX 580 по минимальному fps. Да и по среднему показателю разница между ними небольшая — всего 10,7% в пользу новинки AMD.


Карты протестированы в «ручном» режиме при помощи Fraps. Для теста выбран небольшой эпизод на первом уровне. Прогулка по скверику с расстрелом камней и водной поверхности. Три повтора для каждого режима. Настройки графики максимальные с включенными улучшенными текстурами в разрешении 1920x1080.


В Crysis 2 Radeon HD 7970 выглядит намного лучше. Отрыв от Radeon HD 6970 достигает 50% по среднему fps. GeForce GTX 580 отстает на 24%. Очень маленькая разница с двухчиповым Radeon HD 6990, а по минимальному fps этот двуглавый титан даже хуже. Дело в большом разбросе по минимальному fps. И хотя мы дополнительно увеличили число прогонов до 6, но все равно получали на этой карте от 16 до 31 fps.


Стандартный игровой бенчмарк Frontline. Три пятикратных прогона. Настройки графики максимальные. Тесселяция и Depth of Field включены.



Отличный результат без сглаживания. А вот с AA4x мощности нового Radeon все равно не хватает. Предшественник слабее на 28—36%, GeForce GTX 580 — на 11—14%.


Частота кадров измерялась с помощью Fraps. Выбрана миссия «Молот и наковальня» (Rock and a hard place). После первой контрольной точки мы спускаемся по склону холма в долину до укреплений врага. Тестовая сценка включала, кроме спуска, начало перестрелки при штурме первого ряда укреплений. Огонь велся по двум точкам из-за укрытия через прицел. С учетом простого спуска общий порядок действий легко повторим, а итоговые результаты не зависят от случайных факторов. Плюс в кадре находится не только большая площадь с детализированными текстурами, но и световые эффекты выстрелов, и парочка взрывов. Это помогает создать максимально адекватную картину реальной производительности, как в сложных насыщенных сценах одиночной кампании, так и в многопользовательских схватках. Три повтора. Настройки в положении Ultra при сглаживании AA4x.


А вот в этой игре GeForce GTX 580 и вовсе наступает на пятки новичку AMD. Между ними разница всего лишь 5%.

Выводы

С выпуском Tahiti начинается новая эра для видеокарт Radeon. Прогрессивная архитектура станет основной для дальнейшего развития графических ускорителей AMD в ближайшие годы. В области неграфических вычислений компания AMD сделала значительный шаг вперед, который позволит не только отвоевать свою долю рынка в этой сфере, но и далее развивать и совершенствовать гибридные процессоры Fusion. Но нас в первую очередь интересует игровая производительность нового Radeon HD 7970. С этим у него тоже все обстоит отлично. Он демонстрирует значительное преимущество над предшественником Radeon HD 6970, которое иногда достигает 30—50%. И недавний одночиповый флагман GeForce GTX 580 тоже сдается под натиском мощного новичка AMD. Разница между ними уже поменьше, иногда и вовсе в несколько кадров. Но, к примеру, результаты в Crysis 2 у Radeon просто отличные. Явно сказывается повышение производительности при обработке тесселяции, что было слабым местом старых видеоадаптеров AMD. Благодаря новому 28-нм техпроцессу столь мощное графическое решение по уровню энергопотребления не превысило аппетитов старшего одночипового ускорителя шеститысячной серии. А конкурент от NVIDIA по этому параметру и вовсе окажется в невыгодном положении. Несмотря на заявленные цифры его реальное энергопотребление значительно выше Radeon HD 6970. Еще Radeon HD 7970 является пока что единственным видеоадаптером с поддержкой DirectX 11.1. Среди своих товарищей он также пока единственный, кто предлагает HD3D с поддержкой нескольких мониторов.

Прогрессивное решение с отличным сочетанием потребительских характеристик. Минус у него один — цена. Рекомендованная стоимость составляет 550 долларов, и это самая дорогая однопроцессорная видеокарта в истории ATI/AMD. Вряд ли цена существенно изменится до тех пор, пока NVIDIA не выпустит свои модели нового поколения. Если лишние деньги жмут вам карман, то можете готовиться к покупке — в январе Radeon HD 7970 уже будут доступны в магазинах. Более экономные энтузиасты могут подождать младший Radeon HD 7950, который тоже обещает выйти очень интересным продуктом.

В данной статье мы обошли стороной разгон. Да и набор тестов был невелик. Но, как понятно из названия — это не последняя наша встреча с Radeon HD 7970. Во второй части обзора вы увидите больше игровых приложений и участников. Конкурентов мы сравним не только на стандартных частотах, но и при разгоне. Посмотрим, сможет ли разогнанный Radeon HD 7970 сравнятся с двухчиповым титаном Radeon HD 6990, и удастся ли GeForce GTX 580 компенсировать свое отставание от новичка благодаря повышению частот.

Оборудование для тестирования было предоставлено следующими компаниями:

  • 1-Инком — память G.Skill F3-12800CL8T-6GBRM;
  • AMD — видеокарта Radeon HD 7970;
  • ASUS — видеокарта EAH6970 DCII/2DI4S/2GD5;
  • DCLink — видеокарта PowerColor HD6990 4GB GDDR5;
  • Gigabyte — материнская плата GA-X58A-UD3R;
  • Intel — процессор Intel Core i7-975 EE;
  • Thermalright — Thermalright Venomous X;
  • Zotac — видеокарта GeForce GTX 580 AMP! Edition.

Первый графический адаптер с 28-нанометровым GPU. Комок высоких технологий, сплав запредельной производительности, образцовой функциональности и показательной экономичности. Или попросту говоря – самая быстрая в мире одночиповая видеокарта от AMD – Radeon HD 7970 .

Заждались мы уже от AMD чего-то неординарного, яркого и скоростного. Чуть больше года назад, когда была представлена линейка видеокарт Radeon HD 6900, у них не было шансов тягаться с GeForce GTX 580. Тогда компания осознанно отдала первенство в топ-сегменте, акцентируя внимание на том, что решения на чипах Cayman обладают лучшим, чем у конкурента, соотношением цена/производительность и более энергоэффективны. Но, как и любой серьезный игрок на рынке, компания может длительное время очень успешно предлагать достойные устройства по хорошей цене. Но где-то там, в глубине души… она, конечно же, хочет быть технологическим лидером в своем сегменте.

Radeon HD 7970 дает ей такую возможность. Новинка основана на чипе с принципиально новой архитектурой, который производится по наиболее прогрессивному 28-нанометровому техпроцессу. Гарантирует ли успех такое потенциально очень привлекательное сочетание?

Архитектура Graphics Core Next

Длительное время AMD для своих графических решений использовала архитектуру VLIW (Very Long Instruction Words), которая хорошо оптимизирована для работы с 3D, однако малоэффективна для универсальных вычислений. В подобных задачах довольно высокая теоретическая мощность GPU не давала ожидаемых результатов. Новая архитектура, получившая название Graphics Core Next, разрабатывалась в первую очередь для того, чтобы улучшить эффективность вычислений не связанных напрямую с 3D.

Строительными модулями GCN являются так называемые Compute Unit (CU), основу которых составляют векторные блоки, скалярный сопроцессор и независимый планировщик.

Такая модель организации более универсальна, легче поддается программированию, отладке и анализу. Но основным преимуществом GCN является хороший параллелизм вычислений в многозадачной среде и возможность динамического распределения нагрузки. По этой причине AMD делает акцент на том, что представленные решения с архитектурой GCN это нечто большее, чем просто мощные игровые видеокарты.

В максимальной конфигурации чип имеет 32 блока Compute Unit (суммарно 2048 потоковых процессора), шесть 64-битных контроллера памяти, и продвинутую систему двухуровневого кеширования. В новом ядре по-прежнему используется два блока обработки геометрии, которые были существенно модернизированы.

Функциональные нюансы

Помимо низкоуровневых архитектурных изменений, новинки AMD будут обладать целым набором различных нововведений, улучшающих их функциональность.

DirectX 11.1

Прежде всего, отметим поддержку DirectX 11.1, возможности которого будут реализованы в Windows 8. После выхода данной операционной системы от Microsoft, новая версия API сулит немало интересных возможностей. С предварительным перечнем функций DirectX 11.1 можно ознакомиться .

AMD ZeroCore Power

Функция PowerTune, появившаяся еще в адаптерах серии HD 6900, позволяет оптимальным образом задействовать ресурсы видеокарты, выжимая максимум производительности в рамках заданного теплового пакета. GPU с архитектурой GCN получили в свое распоряжение новый инструмент для оптимизации энергопотребления – AMD ZeroCore Power.

Данная функция, унаследованная от мобильной версии Radeon, позволяет переводить видеокарту в состояние глубокого сна, в котором ее энергопотребление не превышает 3 Вт, а вентилятор системы охлаждения останавливается. Это происходит в том случае, когда монитор переходит в режим stand-by (этот период изменяется в настройках ОС). Технология реализована на аппаратном уровне и не зависит от используемой операционной системы.

Подобный алгоритм работы акселератора настолько очевиден, что возникает лишь вопрос, почему же в железе он реализован только сейчас. Так или иначе, стремление AMD максимально улучшить экономичность своих решений можно только приветствовать.

Любопытно, что в режиме CrossFire все дополнительны адаптеры, не используемые в текущий момент, автоматически переводятся в состояние ZeroCore Power и не издают шума.

Video Codec Engine

Для декодирования видео используется блок, функционально идентичный UVD3, который реализован в чипах Cayman. Это наиболее функциональное решение на рынке, потому данный факт никаких нареканий не вызывает. В тоже время архитектура GCN предполагает наличие аппаратного блока Video Codec Engine, который предназначен для кодирования видео в формат H.264. Чтобы задействовать данную разработку, требуется соответствующее программное обеспечение, которое пока находится в процессе разработки.

В целом, возможность кодирования видео средствами GPU существует достаточно давно, однако ранее для этого задействовались потоковые процессоры. К тому же возможности по настройке, а также финальное качество картинки далеко не всегда устраивали требовательных пользователей. Ныне AMD обещает предоставить возможность гибкой настройки параметров, скорости, а также метода кодирования (возможен гибридный вариант с задействованием потоковых вычислителей).

Partially Resident Textures

Инновационная функция частично резидентных текстур (Partially Resident Textures) позволяет обрабатывать текстуры огромного размера (до 32 ТБ), используя локальную память адаптера, как своеобразный кеш-буфер. Блочный принцип работы с виртуальными текстурами и специальный алгоритм использования мип-уровней позволяет компенсировать задержки при подгрузке необходимых для рендеринга частей.

Данная функция может пригодиться в случаях, когда используется технология MegaTexture. Наглядный пример – игра Rage от id Software. В дальнейшем количество проектов, применяющих такой принцип визуализации, будет лишь увеличиваться.

Специально для перфекционистов улучшен алгоритм анизотропной фильтрации. Новый метод исключает случаи появления небольших артефактов в редких ситуациях, возникающих при обработке некоторых типов текстур. Функция активируется автоматически и не сказывается на общей производительности.

HDMI 1.4a (3ГГц)

Еще одним нововведением Radeon HD 7970 является скоростная версия HDMI 1.4a (3 ГГц) с поддержкой формата Frame Packing, позволяющая получить на подходящем экране стереокартинку не только для просмотра 3D-видео, но и игр в режиме 1080p с частотой обновления 60Гц для каждого глаза.

При этом максимальное разрешение при подключении по HDMI составляет 4096×3112. Таким образом, адаптер полностью готов к грядущей эре видео еще более высококачественных форматов Quad HD/4k.

Eyefinity 2.0

За последнее время несколько важных нововведений получила фирменная мультидисплейная технология Eyefinity. Вторая ревизия значительно увеличивает возможности создания конфигураций с несколькими мониторами. В частности теперь доступны режимы 5×1 с альбомной или портретной ориентациями экранов, а максимальное поддерживаемое разрешение увеличилось до 16384×16384.

Адаптеры с 28-нанометровыми чипами также получили технологию Discrete Digital Multi-Point Audio (DDMA), позволяющую выделить несколько независимых аудиопотоков для различных дисплеев, работающих в рамках Eyefinity.

С появлением Catalyst 11.12 стала возможной работа стереоскопической технологии HD3D на трех мониторах. В феврале ожидается выход драйверов 12.2, которые еще больше разнообразят возможности настройки конфигураций с несколькими дисплеями.

PCI Express 3.0

Видеокарты с GCN первыми получили поддержку PCI Express 3.0. Благодаря улучшенному алгоритму кодирования данных при передаче, пропускная способность шины нового поколения вдвое выше, чем у версии 2.0. В частность для режима х16 это 32 ГБ/c.

Напомним, что в случае с платформой Intel для полноценной работы данного скоростного интерфейса, соответствующую поддержку должны иметь центральный процессор, который собственно содержит контроллер PCI-E 3.0, материнская плата со специальными коммутирующими «вентилями», позволяющими получить необходимую скорость, и графический адаптер.

Что касается процессоров, то формально первыми CPU, которые получат поддержку PCI-E 3.0, должны стать предназначенные для платформы LGA1155 чипы Ivy Bridge, которые предположительно будут анонсированы в начале апреля. Однако в действительности, на рынке уже есть решения с контроллером шины нового стандарта. Речь о процессорах для LGA2011. Официально поддержка PCI-E 3.0 для них не заявлена, однако по факту, при наличии остальных требуемых компонентов экосистемы, шина работает именно в таком режиме.

Любопытно, что компания AMD в данном случае не торопится внедрять поддержку PCI Express 3.0 для своей настольной платформы. На текущий момент чипсеты для AM3+ и FM1 довольствуются шиной версии 2.0. Отчасти такой прагматичный подход оправдан. Возможностей текущей версии интерфейса вполне достаточно для нужд даже наиболее производительных видеокарт. Более того, в конфигурациях с несколькими адаптерами, когда слоты работают в режиме x8 (PCI-E 2.0) не наблюдается снижения производительности в игровых приложениях, соответственно пропускная способность шины не является узким местом платформы. С другой стороны, помимо сугубо маркетингового эффекта (и нужно признать, немалого) практическую пользу от PCI Express 3.0, возможно, удастся получить для GPGPU.

Серия процессоров Southern Islands

При формировании продуктовой линейки на основе решений с GCN, будут использоваться три типа графических чипов, принадлежащих семейству Southern Islands.

Tahiti – решение для максимально производительных адаптеров, которые должны будут удовлетворить запросы самых взыскательных энтузиастов. Для моделей линейки Radeon HD 7900 используется именно это ядро. Pitcairn – основа адаптеров, которые будут предлагаться для достаточно требовательных игроков. Данные GPU задействуются для видеокарт серии Radeon HD 7800. Cape Verde – чип для решений с хорошей энергоэффективностью и достаточной производительностью. Таковыми должны стать модели линейки Radeon HD 7700.

Приведем слайд, который поможет понять позиционирование будущих адаптеров серии Radeon HD 7000.

На начальном этапе 28-нанометровые чипы с архитектуру GCN будут использоваться лишь для видеокарт высокого и среднего уровней. В частности, для устройств серий Radeon HD 7900/7800/7700. Менее производительные видеокарты в линейке HD 7000 будут фактически идентичны тем, что сейчас включены в серии HD 6500/6600 и HD 6450/6350. Очевидно, что контрактный производитель кристаллов, компания TSMC, на текущий момент не в состоянии обеспечить AMD таким количеством чипов 28 нм, чтобы их можно было использовать и для бюджетных решений. В подобных условиях приоритет имеют более сложные, но и более прибыльные устройства.

Radeon HD 7970

Первой из семейства видеокарт с новой архитектурой была представлена Radeon HD 7970 . Давайте посмотрим на ее технические характеристики и сравним со старшей одночиповой моделью предыдущей линейки – Radeon HD 6970.

Графический адаптер основан на чипе Tahiti, который, как уже упоминалось, производится по 28-нанометровой технологии. Новый кристалл содержит 4,31 млрд. транзисторов, что на 63% больше, чем у предшественника, при этом его площадь даже несколько компактнее, чем у Cayman (365 vs. 389 мм2). Тактовая частота GPU увеличилась незначительно – до 925 МГц. АMD решила не форсировать события, преодолевая знаковую отметку в 1 ГГц. В случае с Radeon HD 7970 используется версия Tahiti со всем активными блоками, включая 2048 потоковых процессоров. Вычислительная производительность возросла на 40% и составляет 3,79 TFLOPS. Количество текстурных блоков возросло с 96 до 128, что, с учетом повышенной частоты ядра, позволило получить филрейт на уровне 118,4 ГТ/c. Число модулей ROPs не изменилось, потому пиксельная скорость заполнения практически на прежнем уровне.

Как и предшественник, Radeon HD 7970 использует память GDDR5, работающую на 1375 МГЦ (5500 МГц). Однако теперь передача данных производится по 384-битной шине, благодаря чему пропускная способность увеличена со 176 до 264 ГБ/c. При этом объем локальной ОЗУ для топового решения составляет 3 ГБ. Для традиционной одномониторной конфигурации такая емкость явно избыточна, даже если говорить о 27- или 30-дюймовой панели с разрешением 2560х1600. Однако в конфигурациях с несколькими дисплеями, кадровый буфер значительно увеличивается, потому подобный объем не окажется лишним.

Ознакомившись с техническими характеристиками можно смело говорить о том, что Radeon HD 7970 будет заметно производительнее предшественника с ядром Cayman. Новинка улучшена по всем параметрам, которые влияют на быстродействие GPU. При неизменном максимальном TDP в 250 Вт разработчикам удалось выжать максимум.

Референсная видеокарта

Внешне новинка лишь отчасти напоминает топовую модель предыдущей серии. Строгие прямоугольные формы внешнего кожуха системы охлаждения уступили место конструкции со скругленными углами, ярко-красными вставками и глянцевым покрытием элементов верхней защитной крышки.

Печатная плата имеет длину 270 мм, однако форма системы охлаждения увеличивает устройство до 280 мм. Корпусы Middle-tower даже средней ценовой категории, как правило, обеспечивают беспроблемную установку адаптеров подобных габаритов, в случае же с более дорогостоящими игровыми моделями проблем с размещением Radeon HD 7970 точно не возникнет.

В этот раз AMD не установила радиаторную пластину на тыльной стороне печатной платы. Греющиеся элементы, требующие дополнительного охлаждения, расположены на лицевой панели PCB, потому подобный элемент декора лишь ухудшил бы отвод тепла. Хотя, нужно признать, что анодированная пластина добавляет баллы за внешний дизайн, но в этот раз победила практичность.

На верхней кромке видеокарты расположена пара разъемов для подключения дополнительного питания: шести и восьмиконтактный. Соответствующие переходники с Molex-разъемов должны поставляться в комплекте с видеокартой.

Использование двух микросхем BIOS стало хорошей традицией для старших моделей адаптеров от AMD, и в данном случае компания не стала отказываться от функции Dual BIOS. Немалая часть владельцев таких решений – потенциальные экспериментаторы, которые захотят поиграться с частотами чипа/памяти, в том числе используя для этого и различные версии прошивок. Чтобы обезопасить пользователей от возможных проблем с этой стороны, AMD предлагает две версии BIOS, переключаться между которыми можно с помощью миниатюрного тумблера, расположенного на верхней кромке печатной платы.

По толщине Radeon HD 7970 занимает два слота расширения. На интерфейсной панели расположены четыре коннектора: пара Mini-DisplayPort, HDMI и DVI (Dual-Link). Примечательно, что все разъемы размещены в один ряд, тогда как большую часть крепежной пластины занимает решетка выхлопа системы охлаждения. Напомним, что Radeon HD 6900 имеют еще один порт DVI, расположенный на втором ярусе, что заметно уменьшает площадь решетки, тем самым замедляя вывод нагретого воздуха наружу.

Общая конструкция системы охлаждения во многом схожа с той, что используется для референсных видеокарт на чипах Cayman. К массивному алюминиевому основанию прикреплена крупная испарительная камера, на которую установлена кассета с набором алюминиевых пластин. Данный блок продувается 70-миллиметровым центробежным вентилятором. Чипы памяти, а также силовые элементы контактируют с радиаторной пластиной через теплопроводные прокладки, тогда как GPU сообщается непосредственно с теплосъемником испарительной камеры. Сверху кулер прикрыт защитным пластиковым кожухом. Подобная концепция СО уже доказала свою эффективность, потому вполне логично что AMD предпочла данный кулер для Radeon HD 7970. Важным преимуществом такой системы является то, что практически весь нагретый воздух выдувается за пределы системного блока. Это важный нюанс, особенно когда речь идет о производительных решениях с высоким TDP.

Теперь несколько слов о впечатлениях от работы видеокарты. В режиме покоя графический адаптер работает практически бесшумно, снижая частоту чипа до 300 МГц, а памяти до 600 МГц. Вентилятор вращается со скоростью 1000–1100 об/мин (20% от максимального значения). На открытом стенде этого оказывалось достаточно, чтобы температура GPU не поднималась выше 35 С.

Под нагрузкой вентилятор оживает, плавно увеличивая обороты. Алгоритм линейный, потому резких рывков или перепадов в процессе изменения не ощущается. После длительного прогрева температура чипа повысилась до 77 градусов, пропеллер вращался на 43% от максимума (~2300 об/мин). В таком режиме видеокарта, безусловно, слышна, но о серьезном дискомфорте речь не идет.

Мы также на практике убедились в работоспособности технологии AMD ZeroCore Power. Спустя 20–30 секунд после перехода монитора в режим ожидания, вентилятор кулера видеокарты действительно останавливается. Для охлаждения адаптера в таком состоянии достаточно работы СО в пассивном режиме.

В целом, штатная система охлаждения Radeon HD 7970 демонстрирует достойную эффективность при довольно умеренном звуковом сопровождении под нагрузкой. По этой причине нет сожаления о том, что на начальном этапе подавляющее большинство моделей от различных производителей видеокарт будут основаны на референсных печатных платах и кулерах, отличаясь между собой фактически только наклейками на верхней крышке.

Безусловно, компании работают над устройствами с альтернативными СО. В частности Gigabyte и XFX уже подготовили свои варианты.

Аналогичных шагов стоит ждать и от других весомых игроков на этом рынке. Другой вопрос, насколько эффективнее окажутся такие решения. Конструкции с габаритными тихоходными вентиляторами осевого типа выигрышно смотрятся на открытых стендах, но требуют заметно большего внимания к организации охлаждения внутри корпусов, так как горячий воздух в подобных случаях фактически не выводится за пределы системы.

Разгон

Тем, кто уже успел приобщить Radeon HD 797 0 к жидкому азоту, Tahiti раскрылся во всей красе, удивляя устойчивой работой на 1500–1600 МГц даже в CrossFire-конфигурациях. Оверклокеры, сумевшие обзавестись несколькими Radeon HD 7970, на зависть менее удачливым коллегам активно устанавливают новые мировые рекорды в классических приложениях от Futuremark.

К сожалению, на момент проведения тестирования, имеющиеся средства для разгона не позволяли нам изменять напряжения питания, а также увеличивать частоту GPU выше 1125 МГц – границы, установленной в драйвере. Достичь указанного значения не составило никаких проблем даже со штатным вольтажом. +200 МГц – уже очень неплохая прибавка, по сравнению с рекомендуемым значением, но наверняка это далеко не предел для нового чипа. Вопрос возможности разгона остается открытым, и мы к нему еще обязательно вернемся. Особенно любопытно будет оценить потенциал финальных Radeon HD 7970, которые попадут в розничную продажу. Все же в наших руках побывал инженерный образец видеокарты. Однако уже сейчас можно говорить, что 1 ГГц для Tahiti – это только начало. Учитывая легкость, с которой новому кристаллу даются такие частоты, производители видеокарт в последующем наверняка для своих турбированных модификаций будут изначально использовать более внушительные стартовые значения для графического ядра.

Что касается памяти, то для рассмотренной видеокарты используются 2-гигабитные чипы Hynix H5GQ2H24MFR-ROC с базовой частотой 6 ГГц. Так как штатным значением для Radeon HD 7970 является 5500 МГц, микросхемы изначально имеет определенный запас для разгона.

28-нанометровый техпроцесс творит чудеса. Несмотря на значительно возросшую сложность чипа, а также увеличившееся количество функциональных блоков и транзисторов, Tahiti работает на очень высоких тактовых частотах. В этом отношении их 40-нанометровые предки «сдувались» значительно раньше.

Конфигурация тестового стенда

Процессор: Intel Core i7-3930K

Материнская плата: MSI X79A-GD65 (8D)

Оперативная память: GeIL EVO TWO DDR3-2133 16 ГБ (GET316GB2133C11QC)

Накопитель: HDD WD WD1001FALS (1ТБ, 7200 об/мин)

Блок питания: be Quiet! Dark Power Pro 1000W

Результаты тестирования

Подбирать конкурентов для новинки AMD в данном случае было довольно легко. В первую очередь, это предыдущий флагман – Radeon HD 6970. Еще до начала практических тестов было очевидным, что Radeon HD 7970 окажется быстрее предшественника, вопрос был лишь в том, насколько значительной окажется разница в быстродействии этих решений в реальных условиях. А вот GeForce GTX 580 гораздо более интересный соперник для нового топового решения AMD. Уже более года данная видеокарта является обладателем чемпионского пояса в супертяжелом весе. И соперничество именно с этим адаптером вызывает наибольший интерес.

Первые результаты традиционной синтетики от Futuremark демонстрируют заявку на лидерство Radeon HD 7970. В 3DMark Vantage новинка имеет 20%-ное преимущество над GeForce GTX 580 в стандартном режиме Performance и почти вдвое больший перевес в Extreme – очень достойные показатели.

Схожую картину можно наблюдать и в более технологичном 3DMark 11 . С той лишь разницей, что преимущество в режиме с высоким разрешением и качеством графики составляет более скромные 28%.

Но, это еще не победа. Продукты от AMD всегда очень неплохо показывали себя в синтетических приложениях – вычислительная мощность позволяет, да и возможную программную оптимизацию под эталонные тесты не стоит сбрасывать со счетов. Тем не менее, полученные данные дают определенный повод для оптимизма.

В тесте Heaven Benchmark 2.5 использовался режим c максимальным уровнем тесселяции. Это очень некомфортные условия для чипов AMD предыдущего поколения. В подобных ситуациях серьезное преимущество имеют решения от NVIDIA. Собственно в этом можно убедиться, взглянув на соответствующую диаграмму. GeForce GTX 580 на 37% опережает до недавнего времени топовый Radeon HD 6970. Однако в случае с Radeon HD 7970 ситуация меняется на противоположную. Адаптер с Tahiti оказался проворнее и быстрее флагмана калифорнийцев, пересчитывая миллионы полигонов расторопнее предшественника на внушительные 67%. AMD сдержала слово в отношении скорости обработки тесселяции. Соответствующие блоки нового поколения действительно работают очень быстро. И хотя 4-кратного преимущества в данном случае получить не удалось, прирост в 1,7 раза оказался вполне реален.

Первая реальная игра и от тотального преимущества, исчисляемого десятками процентов, не остается и следа. Всего лишь 2% или 1 кадр/c отделяет Radeon HD 7970 и GeForce GTX 580 в режиме Full HD и порядка 9% при разрешении 2560х1600. Вряд ли шестиядерный Core i7-3930K здесь стал ограничителем.

Вместе с тем отметим, что движок Lost Planet 2 явно благоволит решениям от NVIDIA – уж очень велика разница между GeForce GTX 580 и Radeon HD 6970 (53%). Без хорошей оптимизации под конкретную архитектуру достичь подобного сложно. Тем не менее, играя даже на поле соперника, Radeon HD 7970 пусть и минимально, но все же смог его обойти.

В игре Мetro 2033 наблюдаем уверенное преимущество Radeon HD 7970 над основным оппонентом от NVIDIA. Разница в производительности составляет убедительные 21–26%. Обратим внимание на то, что Radeon HD 6970 здесь также выглядит очень неплохо, уступая более дорогостоящему GeForce GTX 580 всего 2–6%. Однако стоит учесть, что во время проведения теста в настройках игры отключалась опция PhysX. Ее активация добавляет визуальных эффектов, но ставит участников в неравные условия. В случае с решениями AMD расчет физики частиц ляжет на плечи CPU, тогда как с адаптером NVIDIA она будет просчитываться вычислительными блоками GPU посредством API CUDA.

Игра Far Cry 2 в режиме DirectX 10 также резвее бегает на Radeon HD 7970. Вряд ли кто-то способен на глаз ощутить разницу в скорости отрисовки между 153 и 142 кадрами/c, но 8%-ное преимущество все же факт неоспоримый. А с увеличением разрешения оно возрастает до более весомых 22%. В сравнении же с предшественником решение на Tahiti расторопнее на 35%.

Схожая расстановка сил наблюдается и в Colin McRae: DiRT 3 . GeForce GTX 580 на 13–22% отстает от Radeon HD 7970. И, что уже стало закономерностью, отрыв новичка AMD увеличивается с ростом разрешения. Ну, а самый скоростной Cayman в данном тесте довольствуется последним местом, отстав от лидера на 42–47%.

Оценивая производительность новинки, следует сказать и об ее скрытом потенциале, ведь Radeon HD 7970 имеет не просто улучшенную, а принципиально новую архитектуру. Как это часто бывает в подобных случаях, последующая программная оптимизация может принести очень хорошие результаты. Потому, вполне реально рассчитывать на дополнительную производительность решений с GCN по мере совершенствования драйверов. Разработчики наверняка сейчас сконцентрируют внимания на адаптерах линейки Radeon HD 7000. Потому очередные улучшения при обновлении ПО в первую очередь будут ощущать как раз владельцы видеокарт с новой графической архитектурой.

На этапе замера энергопотребления у нас осталось два участника. Дело в том, что в качестве тестовой Radeon HD 6970 использовалась MSI R6970 Lightning , которая, помимо используемого GPU, с референсной видеокартой не имеет ничего общего. Серьезно усиленная элементная база и оригинальная печатная плата не позволяют использовать полученные данные для прямого сравнения. А вот GeForce GTX 580 мы использовали адаптер ASUS ENGTX580/2DI/1536MD5 , который основан на эталонном дизайне и имеет рекомендуемые NVIDIA частотные и электрические характеристики.

Признаться, значения в 70 Вт на циферблате ваттметра весьма впечатляют. Особенно с учетом того, что тестовая система основана на отнюдь не самой экономичной платформе LGA2011 с шестиядерным процессором, четырьмя модулями памяти и двухдисковым HDD 7200 об/мин.

AMD хорошо поработала над тем, чтобы максимально снизить энергопотребление Radeon HD 7970. В режиме простоя система с такой видеокартой потребляет на 18 Вт меньше, чем ПК с GeForce GTX 580. Когда же речь идет о реальной игровой нагрузке, разница увеличивается еще больше – до 50–60 Вт. И это при том, что новинка на Tahiti обеспечивает большую скорость, а соответственно имеет лучшее соотношение производительности на ватт.

Итоги

В AMD, безусловно, уловила тренд гетерогенных вычислений. Более того, в сложившейся ситуации можно сказать, что компания всячески содействуют его развитию. По крайней мере, касаемо аппаратной части. Вполне вероятно, что в глобальном масштабе и недалекой перспективе Graphics Core Next поможет AMD более весомо заявить о себе, как о поставщике решений для самых разнообразных задач и применений: от ультимативных игровых систем, до HPC-вычислений.

Что же касается непосредственно Radeon HD 7970 , то видеокарта заслуживает похвалы. На текущий момент это самый производительный одночиповый графический адаптер. Без каких-либо скидок, оговорок и уточнений. Новинка имеет тотальное преимущество над флагманом предыдущего поколения, обеспечивая на 30–70% более высокие показатели, чем у Radeon HD 6970. Ей также удалось опередить и основного конкурента – GeForce GTX 580 – хотя разница здесь уже более скромная.

Тем не менее, для тех, кто готов потратить на видеокарту порядка $500, выбор не столь однозначен. Цена GeForce GTX 580 с референсной системой охлаждения и рекомендуемыми тактовыми частотами заметно снизилась за последние два-три месяца. Такую модель уже можно приобрести за $460-470. Тогда как розничная стоимость Radeon HD 7970 3GB в Украине ожидается на уровне $600. AMD не то, чтобы переоценила свое устройство, а скорее задала ту планку, с которой Radeon HD 7970 предлагает примерно схожее соотношение цена/производительность, что и у топового решения калифорнийцев. Последнее, хоть и оказывается медленнее, но настолько же и дешевле. Потому демпинга не получилось, хотя очень этого и хотелось. Впрочем, мы знаем, что AMD умеет оперативно реагировать на рыночную ситуацию, умело корректируя свою ценовую политику. К счастью для пользователей, в сегменте дискретной графики имеет место жесткая конкуренция, и нет явного лидера, что часто позволяет в ценовом вопросе расставить все точки над «i» сугубо рыночными методами.

Radeon HD 7970 – добротное решение с отличной производительностью, расширенной функциональностью, технологическими инновациями и хорошим потенциалом. За исключением цены, фактически, других слабых мест данный адаптер не имеет. Так или иначе, майка лидерства заслуженно переходит AMD. По крайней мере, на ближайшие пару месяцев, по прошествии которых NVIDIA также представит собственные разработки с 28-нанометровыми GPU и новой архитектурой Kepler. Так что очередная графическая партия также обещает быть весьма любопытной.

Презентация нового поколения графических процессоров AMD, безусловно, стала одним из наиболее значимых событий последнего квартала 2011 года в IT индустрии. В «гонке вооружений» с NVIDIA, полупроводниковому гиганту из Саннивейла удалось сделать очень важный стратегический ход, первым представив следующее поколение графических процессоров, основанное на чипах, выполненных с соблюдением норм 28 нм техпроцесса.

Таким образом, AMD вновь получила некоторое преимущество перед основным конкурентом на рынке дискретной графики. На момент появления в продаже первых представителей 600-ой линейки графических процессоров NVIDIA GeForce, решения на основе Radeon HD 7970 уже будут присутствовать на рынке, по меньшей мере, пару месяцев, что позволит повысить уровень их продаж, особенно в кругу продвинутых геймеров и энтузиастов, которые стремятся получить hi-end новинки как можно скорее. Демонстрация Radeon HD 7970 , состоявшаяся в Москве 13 декабря, произвела на нас очень приятное впечатление, но только спустя месяц нам удалось наконец-то получить образец видеокарты AMD Radeon HD 7970 в нашу тестовую лабораторию. Однако перед тем как перейти непосредственно к изучению особенностей самого графического ускорителя AMD Radeon HD 7970, стоит рассказать об архитектурных особенностях графического ядра Tahiti XT , которое лежит в его основе.

Особенности архитектуры Graphics Core Next

Напомним, что начиная с линейки Radeon HD 2000, инженеры ATI (а впоследствии AMD) для разработки графических процессоров Radeon использовали архитектуру типа VLIW (very long instruction word). Разумеется, с момента представления чипа R600 до семейства графических адаптеров Northern Island производительность решений возросла в несколько раз, однако принципиально новых изменений за это время всё же не произошло.

Тем не менее, качество графики в PC-играх постоянно повышается, а разработчики находят всё новые пути повышения реалистичности изображения на экране монитора. Разумеется, требования к скорости работы и объёму памяти видеокарт постоянно растут, однако постепенно меняется и характер задач, которые стоят перед ними. Так, например, в последнее время дискретные графические адаптеры всё чаще находят своё применение в «неграфических» приложениях и зачастую выполнение определенной задачи силами видеокарты требует меньше времени и ресурсов. Это один из наиболее приоритетных трендов развития для производителей графических чипов, и в компаниях AMD и NVIDIA это хорошо понимают. Отметим, что разработчики из «зелёного лагеря» осознали необходимость создание принципиально новой унифицированной архитектуры и графического чипа общего назначения (GPGPU или General Purpose GPU) заметно раньше. Как результат, технология NVIDIA CUDA сегодня поддерживается большим количеством программ, включая профессиональные решения. Впрочем, заметное распространение эта технология получила сравнительно недавно, так что у AMD ещё есть все шансы составить достойную конкуренцию в этом сегменте рынка.

Итак, основой нового чипа Tahiti XT на архитектуре Graphics Core Next являются супер-скалярные процессоры именуемые Compute Units, которые включают 64 ALU каждый. Важно отметить, что они состоят из векторных и скалярных блоков, а также имеют встроенный планировщик и 16 килобайт кэш-памяти первого уровня. Применяемая схема их строения позволяет получить более высокую производительность в сравнении с VLIW-архитектурой, а также высокую эффективность, как для решения графических задач, так и задач общего назначения.

Всего в состав чипа Tahiti XT входит 32 блока Compute Unit (2048 потоковых процессоров), которые разбиты в группы по 4 штуки. Каждая такая группа имеет в своем распоряжении 32 КБ кэш-памяти для хранения данных и 16 КБ для инструкций. Помимо этого, как мы уже отмечали, каждый блок CU оснащен собственным кэшем объёмом 16 КБ. Общий объём кэш-памяти первого уровня (L1) составляет 512 КБ, а второго - 768 КБ, что в два раза больше, нежели у предыдущего флагмана линейки Radeon HD.

Ширина шины памяти была увеличена до 384 бит, однако количество растровых процессоров (ROP) не возросло пропорционально до 48, а осталось прежним - 32. При этом принцип их взаимодействия с остальной частью GPU, по заявлениям инженеров AMD, был существенно переработан. Отметим, что новый чип Tahiti XT включает 4,31 млрд. транзисторов на площади 365 мм².

Особое внимание в новой архитектуре, по словам представителей компании AMD, было уделено блоку тесселяции. Со времен линейки Radeon HD 5000 в задачах с активным использованием тесселяции решения от NVIDIA выглядели гораздо предпочтительнее, однако с внедрением блока тесселяции десятой версии в линейке Radeon HD 7000, ситуация может существенно измениться.

Основываясь на данные графика из официальной презентации AMD, в сравнении с предыдущим флагманом, производительность Radeon HD 7970 при обработке тесселяции выросла вплоть до 140% в отдельных приложениях.

Важным нововведением в новой архитектуре Graphics Core Next стал отдельный блок Video Codec Engine. Когда на рынке появится программное обеспечение, позволяющее воспользоваться его возможностями в полной мере, пользователи смогут задействовать вычислительную мощь видеоускорителей не только для декодирования, но и для кодирования видеоконтента.

Немало внимания в новой архитектуре традиционно было уделено вопросам энергопотребления. Технология AMD Power Tune призвана динамически отслеживать нагрузку на графический процессор и в случае превышения максимального уровня TDP (например в стресс-тестах FurMark, OCCT) - автоматически снижать тактовую частоту GPU и напряжение его работы. Таким образом, производитель не идёт на искусственное занижение производительности видеокарты, оглядываясь лишь на синтетические тесты, которые в реальной эксплуатации практически не запускаются.

Ещё одной приятной особенностью Graphics Core Next стала функция ZeroCore. Теперь в режиме бездействия, после того как экран монитора автоматически отключается, видеокарта может автоматически перейти в экономный режим, отключив при этом даже вентилятор системы охлаждения. Энергопотребление графического адаптера в таком режиме не превышает 4 Вт, по словам инженеров AMD.

В режиме CrossFireX при переходе в 2D режим, все адаптеры кроме одного аналогично будут «засыпать» и отключать вентиляторы СО.

Немало внимания в новой архитектуре было уделено и технологии Eyefinity, которая, напомним, позволяет подключать к одной видеокарте одновременно несколько дисплеев в различных режимах. С переходом на Graphics Core Next, технология Eyefinity была обновлена до второй версии и теперь позволяет не только подключать до 6 мониторов к одной видеокарте (при использовании активных переходников, приобретаемых отдельно), но и активировать 3D-режим при подключении нескольких дисплеев. Здесь AMD снова задает новый стандарт в отрасли, ведь для аналогичного режима NVIDIA 3D Vision Surround потребуется установка как минимум 2х видеокарт в режиме SLI.

Кроме этого, для AMD Radeon HD 7970 заявлена поддержка мониторов и LCD-панелей ультравысокого разрешения (7680 × 4320 пикселей), что на теперешний момент уже является неплохим заделом на будущее. Также нельзя не отметить поддержку видеокартами семейства Southern Islands интерфейса PCI Express 3.0. Практической пользы от этого нововведения пока немного, однако, факт внедрения новых стандартов, безусловно, приятен. Отметим, что AMD Radeon HD 7970 стала первой видеокартой на рынке с поддержкой PCI Express 3.0. В завершение рассказа об архитектуре приведем сводную таблицу, в которой мы сравнили спецификации нового флагмана линейки Radeon HD с предшественниками и актуальными конкурентами:

AMD Radeon HD 7970

AMD Radeon HD 6970

AMD Radeon HD 5870

NVIDIA GeForce GTX 580

Кодовое имя

Текстурные блоки

Блоки растеризации (ROP)

Частота графического процессора, МГц

Шейдерная частота, МГц

Частота видеопамяти, МГц

Объём памяти GDDR5, Мбайт

Интерфейс видеопамяти, бит

Разъёмы питания

1 x 6-pin, 1 х 8-pin

1 x 6-pin, 1 х 8-pin

1 x 6-pin, 1 х 8-pin

1 x 6-pin, 1 х 8-pin

Приведенный список нововведений в архитектуре Graphics Core Next выглядит действительно интересно и многообещающе. Что ж, мы переходим к практическому тестированию, для того чтобы на практике изучить все особенности передовых технологий AMD на примере видеокарты Radeon HD 7970 «референсного» дизайна.

AMD Radeon HD 7970

Графическое ядро

Количество потоковых процессоров

Поддерживаемые API

DirectX 11.1 (Shader Model 5.0, DirectCompute 11.1), OpenCL 1.2 и OpenGL 4.2

Частота графического ядра, МГц

Частота памяти (эффективная), МГц

Объём памяти, МБ

Тип памяти

Ширина шины памяти, бит

Максимальное разрешение

До 4 дисплеев по 1920x1200 каждый
До 2560x1600 Dual-link DVI или 1920x1200 Single-link DVI
До 2048x1536 VGA (через переходник DVI-to-VGA)
До 1920x1200 HDMI 1.4
До 2560x1600 DisplayPort

Интерфейсы вывода изображения

1x Single-Link DVI
1x Dual-Link DVI
1х HDMI 1.4
2х Mini-DisplayPort 1.2

Поддержка HDCP и декодирования HD-видео

Есть
Декодирование MPEG-2, MPEG-4, DivX, WMV9, VC-1 и H.264/AVC

Минимальные требования к блоку питания, Вт

Размеры, мм

Драйверы

Свежие драйверы можно скачать:
- сайта производителя GPU

Сайт производителя

Стоит отметить, что в нашу тестовую лабораторию попал не розничный вариант Radeon HD 7970, и даже не финальная ревизия этой видеокарты. Сегодня мы имеем дело с инженерным образцом, который, вероятно, имеет ряд незначительных отличий от тех графических адаптеров на базе Radeon HD 7970, которые уже появились в украинских торговых сетях. Тем не менее, его основные характеристики полностью совпадают с заявленными для AMD Radeon HD 7970, следовательно, и уровень производительности должен быть аналогичным. До того времени когда партнеры AMD представят свои версии Radeon HD 7970 на основе уникального дизайна, все видеоускорители на базе Radeon HD 7970 будут отличаться лишь наклейкой на кожухе системы охлаждения, комплектом поставки, условиями гарантийного обслуживания и, конечно, стоимостью.

Внешний вид видеокарты очень напоминает дизайн предыдущих флагманов линейки Radeon, однако, при этом, отличия между ними хорошо заметны, и Radeon HD 7970 имеет своё собственное «лицо». На наш взгляд, сглаженные края кожуха системы охлаждения и применение глянцевого пластика выглядят более привлекательно, в сравнении со строгим и несколько «кирпичным» видом Radeon HD 6970/6950. Длина видеоускорителя составляет 285 мм, что характерно для hi-end решений. В большинстве современных игровых корпусов формата Middle- и Full-Tower его расположение не доставит проблем.

Для вывода изображения на видеокарте AMD Radeon HD 7970 предусмотрены следующие интерфейсы:

    1x Dual-Link DVI;

    1х HDMI 1.4a (frame packing);

    2х DisplayPort 1.2;

Отметим, что от второго разъёма DVI разработчик отказался, мотивируя это стремлением повысить эффективность системы охлаждения турбинного типа. Вероятно, розничные версии Radeon HD 7970 будут оснащаться дополнительными переходниками и у конечного пользователя не должно будет возникнуть никаких проблем с подключением к видеокарте монитора, плазменной панели или проектора. Напомним, что благодаря технологии Eyefinity 2.0 к графическим ускорителям на AMD Radeon HD 7970 можно подключить до 6-ти мониторов с двумя дополнительными DisplayPort-хабами (приобретаются отдельно). Порт HDMI версии 1.4a с поддержкой frame packing позволяет передавать 3D-изображение с частотой 60 Гц на каждый глаз.

Печатная плата видеокарты AMD Radeon HD 7970, попавшей к нам в лабораторию, выполнена на текстолите красного цвета, однако в розничные каналы поставляются карты на более поздней ревизии PCB черного цвета. Безусловно, стоит отметить применение качественной элементной базы: полевых транзисторов в металлическом корпусе DirectFET, дросселей с ферритовыми сердечниками и твердотельных конденсаторов. Для решения уровня Radeon HD 7970 качественная элементная база не только обеспечит длительную и стабильную работу в штатном режиме, но и позволит добиться лучших результатов в процессе разгона.

Модуль стабилизации питания выполнен по 6+1-фазной схеме, а в качестве ШИМ-контроллера используется микросхема CHiL CHL8228G.

Для обеспечения питания видеокарты, помимо разъёма PCI-E, применяется один 6-контактный и один 8-контактный разъёмы питания, которые расположены сбоку в конце платы.

Два коннектора для мостиков CrossFireX позволяют объединять несколько видеокарт на основе графических процессоров AMD для совместного расчета графических эффектов. Рядом с ними располагается небольшой переключатель BIOS, который впервые появился в линейке Radeon HD 6900.

Обратная сторона платы практически лишена элементов. Здесь мы обнаружили лишь крепежную крестовину системы охлаждения и несколько микросхем модуля VRM. Кроме этого, на инженерном семпле попавшем к нам в тестлаб на обратной стороне печатной платы присутствовало несколько маленьких переключателей и коннекторов непонятного назначения. В финальной версии, очевидно, ничего такого нет.

Так выглядит графический чип Tahiti XT, выполненный по нормам 28 нм процесса, который является центральной частью рассматриваемой видеокарты. Как мы уже упоминали, он включает 2048 унифицированных процессоров и 32 блока растеризации, а обмен данными между графическим ядром и памятью осуществляется через 384-битную шину.

Видеопамять стандарта GDDR5 общим объемом 3 ГБ набрана с помощью двенадцати чипов по 256 МБ производства компании Hynix. Чипы имеют маркировку H5GQ2H24MFR T2C и согласно документации могут функционировать на эффективной частоте до 6 ГГц. Учитывая, что память в тестируемой видеокарте изначально работает на частоте 5500 МГц, есть смысл попробовать немного ускорить ее в процессе ручного разгона.

Система охлаждения видеокарты AMD Radeon HD 7970 «референсного» дизайна включает турбину и достаточно массивный алюминиевый радиатор в основании которого установлена испарительная камера, способствующая равномерному распределению тепла по всей площади теплообменника.

Для эффективного забора воздуха в задней части пластикового кожуха, закрывающего всю лицевую часть печатной платы, присутствуют специальные отверстия.

Графический чип контактирует с основным радиатором напрямую, в то время как чипы памяти и силовые транзисторы соприкасаются через специальный термоинтерфейс с металлической пластиной-основанием, на которой закреплен радиатор и турбина. В целом со времени Radeon HD 6970 штатный кулер не перетерпел значительных изменений, а для того чтобы проверить его эффективность на практике мы провели наш стандартный набор тестов. Традиционно тесты проводились в двух режимах работы кулера: автоматическое управление и максимальная скорость вращения турбины.

В автоматическом режиме при максимальной нагрузке температура графического ядра не превышала отметку 74 градуса, что является неплохим результатом для адаптера такого уровня. При этом вентилятор работал на 50 % своей мощности, производя средний уровень шума, заметный на общем фоне работы системы, но не раздражающий.

После того как мы установили скорость вращения вентилятора на максимум и провели тестирование еще раз, мы зафиксировали снижение максимальной температуры GPU на 12 градусов, а уровень шума, издаваемый кулером при этом, мы бы охарактеризовали, как очень высокий.

При отсутствии нагрузки, частоты графического ядра и памяти автоматически понижаются, что приводит к меньшему энергопотреблению и тепловыделению. Кулер в таком режиме работает действительно тихо, а температура графического ядра не превышает 36 градусов.

В целом система охлаждения на основе испарительной камеры, применяемая для AMD Radeon HD 7970,продемонстрировала хорошую эффективность охлаждения при среднем уровне шума. На фоне остальных компонентов современного системного блока шум от работы видеокарты при типичной нагрузке выделяется незначительно.

При тестировании использовался Стенд для тестирования Видеокарт №3
Выберите с чем хотите сравнить Radeon HD 7970 3GB GDDR5 AMD


По результатам тестирования можно с уверенностью констатировать, что на теперешний момент, видеокарта AMD Radeon HD 7970 является наиболее производительным одночиповым графическим адаптером. В сравнении с предыдущим флагманом прирост быстродействия выглядит очень внушительно и составляет не менее 20% в игровых приложениях и синтетических бенчмарках. Более того, в нескольких тестах, Radeon HD 7970 оказался быстрее не только Radeon HD 6970, но и двухчипового графического «монстра» - Radeon HD 6990. Это ещё раз доказывает тот факт, что, несмотря на постоянное улучшение эффективности режима CrossFireX, мощная одночиповая видеокарта всё еще является более универсальным решением. Тем не менее, однозначную победу над двухчиповым «королем графики», вероятно, сможет одержать лишь гипотетический Radeon HD 7990, который, судя по всему, должен появиться позже в этом году. Важно отметить, что наиболее привлекательно новая архитектура Graphics Core Next выглядит в самых тяжелых графических режимах с активным использованием тесселяции, сглаживания и анизотропной фильтрации. В будущем разработчики игр, вероятно, будут учитывать особенности архитектуры GNC, и спустя какое-то время мы увидим реальный потенциал, заложенный в GNC. Что же касается сравнения с конкурентами из лагеря NVIDIA, то здесь новичок также выглядит неплохо, однако побеждает уже не столь уверенно. В среднем ускоритель на базе Radeon HD 7970 оказался быстрее GeForce GTX 580 на 10-15%, однако, в некоторых тестах получить победу ему так и не удалось. Вероятно, в ближайшие несколько месяцев эта ситуация должна изменится в лучшую для AMD сторону, ведь с выходом новых версий драйверов производительность нового флагмана должна улучшиться. Что же касается энергопотребления, благодаря переходу на новый технологический процесс и дальнейшей оптимизации, то его уровень практически не вырос со времен Radeon HD 6970, что, безусловно, приятно, учитывая заметный прирост производительности.

Разгон

Во время анонса Radeon HD 7970 представители компании AMD открыто заявляли, что новый флагман линейки Radeon изначально создавался с учетом дальнейшего ручного разгона. Напомним, что предыдущая «топовая» одночиповая модель - Radeon HD 6970 не могла похвастать выдающимся разгонным потенциалом при «стоковом» охлаждении, однако в этот раз ситуация должна быть иная. К сожалению, на момент написания материала, утилита MSI Afterburner (и другие) не позволила нам осуществить серьезный ручной разгон видеокарты AMD Radeon HD 7970. Как это часто бывает, возможности для оверклокинга оказались сильно ограничены ползунками изменения частоты.

Тем не менее, в результате наших экспериментов с разгоном нам удалось добиться полной стабильности графического адаптера при частоте графического ядра 1125 МГц (прирост 21,6%) и видеопамяти 6300 МГц (прирост 14,5%). Довольно внушительный результат, который позволяет надеется, что после того как утилиты научатся узнавать новинку, мы сможем получить еще более высокие частоты без необходимости править BIOS, ведь именно с модифицированными версиями BIOS некоторые оверклокеры уже получили заметно лучшие результаты.

Прирост производительности вследствие такого разгона вы можете оценить в таблице ниже:

Тестовый пакет

Стандартные частоты

Разогнанная видеокарта

Прирост
производи
тельности, %

Performance Score

Performance Score

Crysis Warhead, DirectX 10, Maximum Quality, AA4x/AF16x, fps

Far Cry 2, DirectX 10, Ultra Quality, NO AA/AF, fps

Aliens vs. Predator DX11 Benchmark, Maximum Quality, NO AA/AF, fps

Aliens vs. Predator DX11 Benchmark, Maximum Quality, AA4x/AF16x, fps

Colin McRae: DiRT 2, DirectX 11, Maximum Quality, NO AA/AF, fps

Colin McRae: DiRT 2, DirectX 10, Maximum Quality, AA4x/AF16x, fps

Прирост производительности в среднем составил около 13%, причем основной вклад в это сделало именно ускорение GPU, что является очень хорошим показателем для Hi-end продукта и позволяет заметно повысить и без того высокую частоту смены кадров.

Выводы

Безусловно, новый флагман линейки графических процессоров AMD Radeon HD получился действительно удачным продуктом, который будет в ближайшее время задавать стандарты для Hi-end продуктов на рынке дискретной графики. Список нововведений по сравнению с предыдущим поколением выглядит более чем внушительно: переход на новый 28 нм техпроцесс, инновационная архитектура, внедрение поддержки PCI-E 3.0 и технологий Eyefinity 2.0, ZeroCore, Power Tune, поддержка ультравысокого разрешения и передачи 3D изображения через HDMI-порт и т.д. Отметим, что архитектура не только позволила нарастить количество функциональных блоков и повысить уровень производительности в игровых приложениях и бенчмарках. Мы будем надеяться, что в будущем разработчики прикладного программного обеспечения обратят внимание на преимущества Graphics Core Next, что позволит активно применять видеокарты на её основе для решения широкого спектра задач. «Референсный» ускоритель AMD Radeon HD 7970 произвёл на нас приятное впечатление благодаря эффективной системе охлаждения на основе испарительной камеры, применению качественной элементной базы и хорошему разгонному потенциалу, который нам, к сожалению, не удалось раскрыть в полной мере. Стоимость нового флагмана линейки AMD Radeon не назовешь демократичной ($550), однако, на наш взгляд, для заядлых энтузиастов и хардкорных геймеров она окажется не столь высокой, учитывая отличную производительность и функциональность этого решения.

Достоинства:

    Высочайший уровень производительности;

    Поддержка DirectX 11.1, OpenGL 4.2 и большого количества фирменных технологий;

    Новая универсальная архитектура Graphics Core Next;

    Эффективная и достаточно тихая система охлаждения в автоматическом режиме;

    Хороший разгонный потенциал;

  • Качественная элементная база.

    Подписаться на наши каналы

График температурных режимов видеокарт

Даже если бы новинка показала не самые лучшие «температуры», после столь высоких результатов производительности мы бы смогли ей это простить. Но в нашем великодушии нет необходимости. Radeon HD 7970 греется меньше, нежели предшественник (Radeon HD 6970) при гораздо более высокой производительности. При этом, как я говорил выше, если не изменять скорость вращения вентилятора самостоятельно, то, чтобы услышать карту придется очень постараться. Думаю, при закрытом корпусе это и вовсе невозможно.

При разгоне температуры ниже, чем на стандартных настройках, из-за того самого ручного увеличения оборотов для стабильности.

Кстати, у нас есть еще несколько тестов этой же видеокарты с альтернативной СО и на другой системе. Вы можете ознакомиться с результатами, чтобы понять, как современные процессоры влияют на производительность в популярных приложениях. Стоит отметить, что стоковая система охлаждения на видеокарте производства ASUS проиграла всего один градус в номинале двухвентиляторной системе от XFX , это хороший результат.

Заключение

Разгон видеокарты ASUS HD 7970 приятно удивил. Графический процессор разогнался с дефолтных 925 МГц до 1200 без увеличения напряжения. Этим и обусловлен столь высокий прирост производительности при разгоне. Если честно, то это очень приятный момент. В последнее время видеокарты разгоняются все хуже, поэтому надобность в оверклокинге пропадает: если видеокарта не вытягивает игру в дефолте, то бедный разгон на 50 МГц ситуацию не исправит. Здесь явно другой случай.

Единственное, что смущает в новинке, это непомерный уровень шума при ручном увеличении оборотов. А оно необходимо для успешного разгона, иначе вы имеете все шансы спалить видеокарту. Но, я думаю, со временем эта проблема будет решена - появится множество альтернативных систем охлаждения. Главное, чтобы разгонный потенциал не изменился в худшую сторону.

Высокая производительность, низкое тепловыделение, а также новые фирменные технологии делают видеокарту AMD Radeon HD 7970 лучшим однопроцессорным видеоадаптером на сегодняшний день. Более того, при разгоне новинка легко тягается с двухпроцессорным монстром Radeon HD 6990. Поэтому если у вас возник вопрос: «что лучше: HD 7970 или HD 6990?», то я рекомендую выбрать первый вариант. С ним у вас не будет проблем при активации CrossFireX, не будет внезапных просадок производительности, как это бывает с двухголовыми картами. Три гигабайта видеопамяти - приятный бонус к покупке. К сожалению, использоваться они будут крайней степени редко, но лучше с ними, чем без них.

В общем, видеокарта ASUS HD 7970 удалась на славу, и оставляет очень приятные впечатления. Будем надеяться, что продолжение новой линейки, которое выйдет уже совсем скоро, порадует нас не меньше.

Введение

Архитектура графических процессоров AMD (ATI) не подвергалась существенным изменениям со времен серии Radeon HD 2000: вплоть до HD 6000 в GPU использовался VLIW-дизайн. Что это такое? Сначала вспомним, как работает центральный процессор в наших персоналках. Современные CPU - суперскалярные, то есть их вычислительные блоки могут выполнять несколько инструкций из одного потока одновременно. Но инструкции при этом должны быть независимыми друг от друга, поэтому процессор непрерывно проверяет, когда можно выполнять параллельные операции, а когда нужно подождать разрешения очередной зависимости. Кроме того, CPU занимается предсказанием ветвлений и может делать часть работы заранее (out-of-order). Оптимизация этих функций - сложная техническая задача, а схемы, на которых они построены, занимают добрую часть кристалла CPU.

Но есть другой путь: задать порядок исполнения инструкций на этапе компиляции кода. Компилятор сам находит инструкции, которые можно выполнять одновременно, и формирует из них длинные составные конструкции. Отсюда и термин VLIW - very long instruction word. VLIW в общем случае показывает высокую эффективность, когда код содержит мало зависимостей, а ход программы предсказуем. Компилятор «знает» код от начала до конца и может задать исполнение определенных фрагментов с большим запасом по времени. Но планирование получается жестким, и в случае когда ход программы зависит от внешних данных, хитроумная компиляция уже мало помогает, исполнительные блоки простаивают и производительность идет вниз.

Но рендеринг 3D-графики - предсказуемая задача и отлично распараллеливается. Поэтому ставка на VLIW, которую сделала тогда еще независимая канадская компания, себя полностью оправдала. Переложив функции планировщика на компилятор, ATI могла делать относительно компактные чипы с бешеными сотнями исполнительных элементов внутри, и видеокарты в результате получились относительно недорогими. Звездный час VLIW в исполнении AMD пришелся на время Radeon HD пятитысячной серии, когда дебют архитектуры Fermi от NVIDIA (GeForce 400) немного забуксовал. И неудивительно, ведь «зеленым» приходится делать огромные чипы, вплоть до трех миллиардов транзисторов. И даже сейчас, когда в адаптерах GeForce 500 архитектура Fermi уже работает на полную мощность, а топовые ускорители NVIDIA побеждают в бенчмарках продукцию AMD, шеститысячные Radeon все еще обеспечивают отличную производительность в играх.

В таком случае, зачем AMD решилась на столь резкий поворот? Казалось бы, достаточно немного отполировать дизайн GPU, нарастить вычислительных блоков тут и там, внедрить более тонкий технологический процесс — и VLIW будет жить долго и счастливо. Зачем тратить время и деньги на разработку совершенно новой архитектуры? Но дело не только и не столько в играх. GPU медленно превращаются из устройств, предназначенных исключительно для 3D-рендеринга, в процессоры общего назначения (GPGPU - general purpose GPU), которые можно использовать для любых массированных параллельных вычислений. Однако на сегодняшний день вышло так, что если мы говорим GPGPU, то подразумеваем CUDA. Ни родной для «красных» API под названием ATI Stream, ни Open CL не имеют такой популярности, как CUDA от NVIDIA. Между тем AMD очень хочет откусить кусок от этого рынка, но чтобы это стало возможным, со старой доброй архитектурой VLIW придется расстаться. Для неграфических вычислений она не подходит, ибо они менее предсказуемы, чем 3D-рендеринг, и GPU просто не в состоянии работать в полную силу.

Архитектура Graphics Core Next

Возьмем последнего представителя VLIW-архитектуры от AMD, процессор Cayman, который лежит в основе адаптеров Radeon HD 6950/6970/6990. Основным компонентом шейдерного домена у него является SIMD Engine - блок из шестнадцати потоковых процессоров. Все они одновременно исполняют одну VLIW-инструкцию, но применительно к разным данным (потому и SIMD - single instruction, multiple data). В свою очередь, в одной VLIW-инструкции может быть упаковано вплоть до четырех скалярных операций, что соответствует четырем ALU внутри одного потокового процессора.

Строительный блок ядра Graphics Cores Next (GCN) называется Compute Unit, и он устроен совершенно по-другому. В нем тоже 64 ALU, но они разделены на четыре отдельных векторных SIMD-модуля по 16 штук плюс блок планировщика. Проще говоря, раньше параллелизм был реализован за счет нескольких операций в одной инструкции, а теперь за счет нескольких отдельных SIMD-блоков. И если производительность старой архитектуры зависит от того, сколько скалярных операций компилятор может закодировать в одной VLIW-инструкции, то Compute Unit в ядре GCN может динамически распределять нагрузку между SIMD-блоками.

Нагрузка для параллельного исполнения в SIMD-блок поступает в виде массива (wavefront) из 64 инструкций, который выполняется за четыре цикла. И хотя одновременно в работе могут быть только четыре массива, еще 28 находятся у Compute Unit в прямом доступе, за счет чего планировщик и получает пространство для маневра. В ситуации, когда зависимость в коде мешает комбинированному SIMD-блоку VLIW-процессора работать на полную мощность, отдельные SIMD-блоки чипа GCN просто переключатся на другие массивы из той же задачи либо вовсе на другие задачи.

Изюминка GCN - отдельный скалярный модуль в каждом Compute Unit. Он предназначен для разовых операций, не укладывающихся в wavefront (что избавит SIMD-модули от неэффективного использования), а еще - для контроля исполнения программы: условных ветвлений, переходов и прочих событий, которые Cayman переваривал с трудом. Скалярный модуль выполняет одну операцию за цикл.

Кеш-память

Новая конструкция исполнительных модулей требует более быстрой и объемной кеш-памяти по сравнению c VLIW-дизайном. У каждого CU есть отдельный кеш L1 объемом 16 Кбайт плюс хранилище для инструкций и данных на 16 и 32 Кбайт, общее для четырех CU, - буфер для разделения данных между массивами. Еще есть полностью когерентный кеш L2, поделенный на порции по 64 Кбайт между двухканальными контроллерами памяти. В нем хранятся копии вышеупомянутых буферов

Шины кешей L1 и L2 имеют разрядность 64 байт. AMD сообщает, что пропускная способность L1 достигает почти 2 Тбайт/с, а L2 - 700 Гбайт/с, и, судя по всему, здесь имеется в виду суммарное значение для процессора с 32 CU.

Для сравнения: у Cayman каждый SIMD-модуль имеет кеш L1 объемом 8 Кбайт с шиной 16 Байт.

Обработка геометрии, растеризация

О собственно графических компонентах чипа в презентациях AMD, сопровождающих релиз, сказано немного. Судя по блок-схеме, их внутреннее устройство не изменилась, только «Тесселятор» прокачался до девятой версии и обеспечивает гигантский прирост быстродействия в соответствующих задачах.

Между тем, если верить информации из посторонних источников и слайдам самой AMD с июньского Fusion Development Summit, то изнутри Geometry Engine и Tesselator выглядят совсем по-другому. Как и Cayman, ядро GCN содержит два Graphics Engine, но если раньше они состояли из отдельных блоков для растеризации, тесселяции и так далее, то теперь в каждом GE может быть произвольное количество конвейеров для обработки пикселей и геометрических примитивов.

Вероятно, такой дизайн поможет производителю легко наращивать графическую мощь либо выпускать бюджетные GPU, урезанные по этой части. Быстрая работа с геометрией придется в современных играх как нельзя кстати.

PCI-E 3.0

Заголовок говорит за себя: AMD внедрила шину PCI-E нового поколения со вдвое большей пропускной способностью. Непонятно, нужна ли она сегодня для 3D-рендеринга, но для неграфических расчетов наверняка пригодится. AMD внесла в архитектуру GCN массу нововведений с далеким прицелом на такое применение и специальную функцию графики, которая тоже отлично сочетается с новым интерфейсом.

Новые функции GCN

В GCN есть два дополнительных блока распределения команд под названием Asynchronous Compute Engine, которые работают совершенно независимо друг от друга и графического командного процессора. AMD планирует открыть доступ к ACE через Open CL, и тогда в распоряжении программистов окажутся три отдельных устройства, каждое со своей очередью команд. Кроме того, по информации из третьих рук, ACE обеспечивает внеочередное исполнение на уровне отдельных задач. Сами CU хоть и поумнели по сравнению с SIMD-модулями VLIW-архитектуры, но могут обрабатывать свои wavefront’ы строго в прямом порядке.

Ядро GCN и центральный процессор компьютера могут иметь общее адресное пространство. В таком случае все инструкции, которые попадают на исполнение в GPU, указывают на адреса в пространстве x86-64, а он уже самостоятельно перекодирует их в адреса локальной видеопамяти при помощи специального модуля. В результате GPU получает прямой доступ к системной памяти. Кроме того, ядро GCN наделили рядом функций для поддержки языков высокого уровня: виртуальными функциями, указателями, рекурсией и так далее. Это позволит программистам писать универсальный код, пригодный для исполнения на CPU или на GPU.

Новые GPU полностью совместимы с API OpenCL 1.2, DirectCompute 11.1 (и DirectX 11.1 как таковой) и C++ AMP. Появились специальные инструкции, полезные для производства мультимедийного контента. Кроме того, чипы на базе архитектуры GCN стали первыми GPU со встроенным кодировщиком видео стандарта H.264, который можно будет использовать, как только AMD выпустит необходимую библиотеку софта.

В свою очередь, декодер приобрел поддержку нескольких дополнительных форматов: MVC, MPEG-4/DivX и Dual Stream HD + HD. Вообще, видеокарты Radeon были сильны по части воспроизведения видео еще во времена ATI. У семитысячной серии есть масса «улучшайзеров» картинки, например алгоритм Steady Video, устраняющий дрожание камеры.

Partially Resident Textures - еще один трюк с виртуальной памятью, который предназначен уже для 3D-рендеринга: приложение или шейдер работают с адресным пространством, превышающим объем набортной памяти адаптера, а она сама выступает лишь в качестве быстрого кеша. Таким образом можно использовать текстуры объемом до 32 Тбайт, порции которых GPU будет динамически подкачивать поближе к себе. Поддержка со стороны ОС в этом не требуется.

Тормоза, которые неизбежно возникнут при загрузке текстур из системной памяти, AMD отчасти компенсирует использованием MIP mapping’a. Гигантская текстура наверняка будет храниться в нескольких вариантах с различным разрешением (mipmaps). Каждый из них разделен на фрагменты объемом 64 Кбайт. Когда адаптеру требуется определенный фрагмент, и он уже есть в локальной видеопамяти, то нет проблем. Если же фрагмента не оказалось, то программа может немедленно потянуть его из системной памяти, а может отложить чтение и взять для текущего кадра соответствующую копию фрагмента с низким разрешением (если он уже есть в видеопамяти).

Небольшое дополнение к вопросу о тесселяции. В GCN реализован алгоритм Ptex (Per-face texture mapping). В общем случае в 3D-моделировании текстура накладывается на модель целиком и вершины необходимо аккуратно совмещать с нужными участками двухмерного полотна. Нетрудно представить, как аппаратная тесселяция, плодящая дополнительные вершины, усложняет задачу дизайнера. При использовании Ptex на каждый полигон накладывается отдельная текстура, в результате - никаких видимых стыков. Кроме того, Ptex позволяет упаковывать в один файл текстуры с различным разрешением.

Наконец, AMD немного поработала над анизотропной фильтрацией с целью устранить едва заметное мерцание на текстурах высокого разрешения. Изменение алгоритма не должно сказаться на быстродействии.

Контроль энергопотребления

AMD отмечает, что производители GPU и видеокарт всегда перестраховываются на счет энергопотребления и устанавливают тактовые частоты с учетом пиковой нагрузки, которая возможна лишь в самых жадных приложениях или даже в стресс-тестах (FurMark. OCCT). А в обычных играх графический процессор мог бы работать на более высокой частоте. Для того чтобы всегда выжимать из GPU максимум, предназначена технология PowerTune - калькулятор, который в реальном времени с интервалами в единицы миллисекунд рассчитывает энергопотребление карты на основе анализа выполняемой задачи (без всяких аналоговых сенсоров). И если есть возможность, тактовая частота GPU увеличивается. Заметьте, это не сброс частоты относительно номинала при достижении порога мощности, а наоборот - точно выверенный динамический разгон.

А еще ядро GCN умеет полностью отключаться, когда на экране долго ничего нет, и останавливать кулер (технология ZeroCore). В конфигурации CrossFire процессоры на дополнительных картах (и на одной - тоже) и вовсе не работают без 3D-нагрузки.

Eyefinity 2.0

Вместе с Radeon HD 7000 дебютирует вторая версия технологии Eyefinity, которая принесла массу нововведений. Многие представленные «фичи» не нуждаются в комментариях, поэтому перечислим их кратко:

  • Официально поддерживаются конфигурации с пятью дисплеями в ряд в альбомной или портретной ориентации.
  • Центральный монитор в ряду теперь может быть больше остальных по вертикали.
  • Одновременная работа Eyefinity, AMD HD3D и CrossFire.
  • Максимальное разрешение комбинированного экрана - 15х15 тысяч пикселей.
  • Произвольные разрешения.
  • Перемещение панели задач Windows на любой экран.
  • Вывод отдельных аудиопотоков на несколько дисплеев.

Новые Radeon поддерживают DisplayPort 1.2, а значит - технологию Multi-Stream. С ее помощью можно подключать к одному выходу три дисплея по цепочке или через специальный хаб. Причем на выходе хаба может быть не только DisplayPort, но и интерфейсы HDMI, DVI и VGA. AMD обещает, что хабы появятся в продаже летом 2012 года.

HDMI-выход соответствует стандарту 1.4а, поэтому может передавать двойной сигнал на 3D-телевизор с частотой 24 кадра на каждый канал. А специально для игр есть поддержка 3 GHz HDMI с частотой 60 Гц на канал.

Кроме того, стандарты DisplayPort 1.2 HBR 2 и 3 GHz HDMI пригодятся для подключения грядущих дисплеев с разрешением 4096x2160.

Radeon HD 7970

Технические характеристики

HD 7970 - одночиповый флагман линейки, представляющий архитектуру GCN во всей мощи. Его GPU называется Tahiti и содержит 32 CU (Compute Units), устройство которых подробно описано выше. Если пересчитать это на количество отдельных ALU, как AMD делала до сих пор, то получится 2048 штук - в полтора раза больше, чем в ядре Cayman! И блоков TMU (texture mapping units) в Tahiti тоже 128 против 96. Шина памяти - 384-битная вместо 256-битной. Если учесть, сколько дополнительной логики добавили в архитектуру, то совершенно не удивительно, что Tahiti состоит из 4,31 миллиарда транзисторов. Просто для сравнения: в Cayman - 2,64 миллиарда, а в GF110 от NVIDIA - три. Работает все хозяйство на частоте 925 МГц. Внешний вид, конструкция

В оформлении семитысячной серии AMD отступила от брутальных форм Radeon HD 6000 и выбрала броский дизайн с плавными линиями и глянцевой поверхностью кожуха. Вернулся узнаваемый красный текстолит, в этот раз - с малиновым оттенком. По габаритам Radeon HD 7970 не отличается от предшествующих одночиповых флагманов AMD/ATI.

Продукция кирпичного завода AMD

Карта тяжелая. Берешь в руку - и чувствуется мощь. Все дело в системе охлаждения с крупной испарительной камерой, приделанной к толстой раме. Со времен Radeon HD 6970 конструкция не претерпела больших изменений, разве что вентилятор-турбинка стал шире.

Для лучшего охлаждения с заглушки убрали один порт DVI, чтобы целиком занять слот выхлопной решеткой.

С задней стороны, как и раньше, есть прижимная крестовина. От сплошной крышки решили отказаться.

На печатной плате, как и у HD 6970, есть переключатель между основным и резервным BIOS. А еще по задней поверхности разбросано несколько мелких сдвоенных переключателей неизвестного назначения, которые мы, от греха подальше, решили не трогать. Возможно, что перед нами лишь инженерный образец HD 7970 и на серийных платах этих странных элементов уже не будет.

В хвосте платы расположены семь катушек индуктивности и восьмифазный контроллер напряжения CHiL CHL8228G, чему, без сомнения, будут рады оверклокеры, ведь о н уже использовался на картах Radeon HD 6970, . Скорее всего, и схема питания карты организована по-старому: шесть фаз приходятся на GPU и одна отдана для питания внутренних цепей микросхем GDDR5. В противоположном углу платы находится двухфазный чип uP1509P от uP Semiconductor со своей катушкой, который, по аналогии с HD 6970, должен контролировать напряжение на буферах ввода-вывода видеопамяти.