Особенности видеокарт Nvidia четырехтысячной серии

С 12 октября 2022 года компания Nvidia выпускает в продажу видеокарту GeForce RTX4090 – одну из лучших моделей своей новой 4000-й серии. Это мощнейшие графические адаптеры, созданные на основе архитектуры Ada Lovelace (Ада Лавлейс). Они имеют беспрецедентную производительность при работе с искусственным интеллектом, обработке 3D-приложений, в играх, многопотоковых вычислениях на GPU.

Почему компания Nvidia назвала архитектуру своих видеокарт именем Ады Лавлейс?

Ада Лавлейс — это выдающаяся женщина-математик, которая еще в начале XiX века занималась улучшением/программированием вычислительной машины Чарльза Беббиджа, а также ввела в обиход такие термины, как цикл и рабочая ячейка.

В связи с этим Ада Лавлейс считается самым первым известным программистом в истории.

Название «Ада Лавлейс» в новой архитектуре видеокарт NVIDIA продолжает традиции компании по использованию имен выдающихся ученых, сделавших значительный вклад в математике, физике и электротехнике (ранее это были Ферми, Максвелл, Паскаль, Тьюринг, Ампер, Тесла а теперь — Лавлейс).

Какие особенности имеет архитектура Ada Lovelace видеокарт Nvidia?

Архитектура Ada Lovelace видеокарт Nvidia имеет ряд преимуществ в сравнении с предыдущей (Ampere):

значительно увеличилось количество транзисторов (вычислительных ядер) на единицу площади. Это позволило поднять частоту их работы и производительность, снизив потребление;
используются новые RT-ядра и более быстрая (примерно в два раза) прорисовка тензорных лучей;
за счет добавления технологии Shader Execution Reordering увеличена производительность шейдерных ядер, что особенно эффективно проявляется в приложениях/играх, использующих Ray Tracing;

добавлена поддержка технологии NVIDIA DLSS 3. Это совершенно новый Optical Flow ускоритель и AI frame генератор, который ускоряет рендеринг в 2-4 раза.

https://img.gigglehd.com/gg/files/attach/images/13773/316/960/012/f262787a952e2c92f1e4b96ac17e22f0.jpg

Полноценный AD102-кристалл содержит:

12 графических кластеров (GPC);
72 текстурных кластера (TPC);
144 стриминговых мультипроцессора (SM). Каждый из них включает 128 CUDA ядер, одно RT ядро, 4 тензорных ядра, 4 текстурных юнита, 256 KB файл регистра и 128 килобайт кеша L1;
288 FP64-битных ядер (по два на один SM);
384-битную шину памяти с 12-ю 32-битными контроллерами.

Блок-схема AD102-чипа со всеми юнитами:

Видеокарта 4000-й серии с «необрезанным» GPU AD102 содержит:

18432 CUDA-ядра;
144 RT-ядра;
576 тензорных ядер;
576 текстурных юнитов.

Один графический кластер видеокарт 4000-й серии (AD10x GPU) включает 6 TPC, 12 SM и 16ROP:

Сравнение чипов AD102 и TU102 (RTX2000-я серия):

Сравнение чипов AD102 и GA102 (RTX3000-я серия):

Какие технические характеристики имеет видеокарта NVIDIA GeForce RTX 4090?

Технические характеристики графического адаптера NVIDIA GeForce RTX 4090 (в сравнении с графическим адаптером Nvidia GeForce RTX 3090):

Дата начала производства — 12.10.2022 (01.09.2020);
Графический процессор — AD102-300-A1 (GA102-300-A1);
Архитектура — Ada Lovelace (Ampere);
Технический процесс, нм — 5 (8);
Количество транзисторов, млрд. — 76.3 (28.3);
Площадь кристалла, mm² — 608 (628);
Количество стриминговых мультипроцессоров (SM Count) — 128 (82);
Количество шейдерных ядер (Shading Units) — 16384 (10496);
Количество блоков TMU/ROP — 512/192 (328/112);
Частота работы GPU, МГц — 2235-2520 (1395-1695);
Производительность FP32, TFLOPS — 82.58 (35.58);
Производительность FP64, GFLOPS — 1290 (556);
Объем видеопамяти, GB — 24;
Тип видеопамяти — GDDR6X;
Тактовая частота памяти, МГц/эффективная частота, Gbps — 1325/21.2 (1219/19.5);
Разрядность шины памяти, бит — 384;
Кеш L2/L3, MB — 96/- (6/-);
Полоса пропускания памяти, GB/s — 1018 (936.2);
Поддержка CUDA/OPENCL — 8.9/3.0 (8.6/3.0);
Теоретический хешрейт на алгоритме ethash, MH/s (согласно производительности VRAM) — 127 (117);
TDP, ватт — 450 (350);
Теоретическая энергоэффективность, MH/s на ватт, не хуже 0.28 (0.33).

GPU 4000-й серии созданы по 5-нм технологическому процессу (TSMC 4N), что является серьезным шагом вперед по сравнению с видеокартами Ampere трехтысячной серии, которые создавались по 8-нм технологии.

В технологическом процессе TSMC 4N используется именно 5-нм размер полупроводниковых кристаллов, но с различными улучшениями в сравнении с эпохой 5N (настоящий 4-нм процесс будет называться TSMC N4).

Интересно отметить, что на GeForce RTX 4090 используется только 128 SM-ядер из максимально возможных 144. Таким образом, через некоторое время должны появиться видеокарты GeForce RTX 4090Ti/Titan со всеми 144 стримиинговыми процессорами. Производительность титановой видеокарты при вычислениях будет на 10-15% выше обычной модели.

Размер быстродействующего кеша L2 на GeForce RTX 4090 увеличился в 16 раз – с 6 до 96 мегабайт!

Вероятно, это связано с необходимостью ответить на преимущества видеокарт AMD, связанные с технологией Infinity Cash/Smart Access Memory.

Какие аппаратные особенности имеют видеокарты NVIDIA GeForce RTX 4090?

Для использования видеокарт NVIDIA четырехтысячной серии, в частности, GeForce RTX 4090, нужно использовать драйвера:

на компьютерах под управлением Windows — не старее версии 522.06;
на PC под Linux – 520.61.05 или новее.

Видеокарты NVIDIA GeForce RTX 4000-й серии имеют аппаратную поддержку compute capability 9.0 (видеокарты NVIDIA Hopper и NVIDIA Ada Lovelace), реализованную в CUDA Toolkit начиная с версии 11.8.

В них используется улучшенный алгоритм взаимодействия с центральным процессором компьютера, оптимизирована работа мультипроцессорной системы, а также ряд других улучшений:

Для питания RTX4090 Founders Edition используется 12-pin коннектор (Molex Micro-Fit 3.0) дополнительного питания:

Назначение коннекторов разъема дополнительного питания RTX4000-х аналогично схеме, опробованной на референсных RTX3000:

Теоретически через разъем Molex Micro-Fit 3.0 при использовании проводов 16AWG может подаваться до 600 ватт мощности. Для RTX4090 могут использоваться переходники с проводами 18AWG, которые обеспечивают передачу 500 ватт мощности.

Так как 4090-я кушает не более 450 ватт, то при использовании 12-пинового коннектора по линии дополнительного питания обеспечивается хороший запас. В связи с этим некоторые производители видеокарт могут использовать на своих изделиях по два 6+2-pin стандартных разъема питания, способные выдать до 450 ватт мощности (два по 225w).

Для подключения GeForce RTX4090 к блоку питания нужно использовать переходники с 3-4 ответвлениями на коннекторы 6+2 pin, так как в случае использования переходников с двумя ответвлениями через провода/места соединений контактов будет проходить слишком большой ток.

Различия между мощным 450-ваттным (слева) и более слабым 350-ваттным (справа) переходниками питания мощных 12-пиновых видеокарт:

В системе питания типовых видеокарт Nvidia RTX 4090 используется 23 фазы питания, что обеспечивает очень стабильную работу:

Какой хешрейт могут обеспечить видеокарты Nvidia 4000-й серии и стоит ли их покупать для майнинга?

Учитывая высочайший уровень производительности видеокарт Nvidia GeForce RTX4000-й серии, они смогут обрадовать своим хешрейтом даже требовательных майнеров. На алгоритме ethash эти видеокарты могут выдавать до 130-135 MH/s.

Для полноценного использования их возможностей желательно использовать программы, скомпилированные с поддержкой compute capability 9.0 (CUDA Toolkit 11.8 и новее).

Хешрейт видеокарт Nvidia GeForce RTX 4090 при майнинге:

autolykos v2 (ERGO) — 260-280 MH/s (lolminer 1.60);
GrinCuckatoo31/32 — 3-4 G/s;
CuckooCycle — 13-14 G/s;
kaspa — 2.2 GH/s (lolminer 1.60);
equihash 125.4 (FLUX) — 145-150 sol/s (miniz 1.9z3);
equihash 144.5 (zhash) — 200 sol/s (miniz 1.9z3);
ethash/etchash — 130-140 MH/s;
kawpow — 60-70 MH/s (gminer 3.07);
octopus — 190 MH/s;
sha512256d — 3.5-3.8 GH/s (Radiator1.0.0).

В связи с тяжелой ситуацией, сложившейся в мире в настоящее время, покупка видеокарт уровня Nvidia GeForce RTX4090 для майнинга представляется (мягко говоря) не очень разумным вложением средств.