https://img.gigglehd.com/gg/files/attach/images/13773/316/960/012/14a8fed22464639dff310727427fade6.jpg
Hardware

О видеокартах NVIDIA 4000-й серии

С 12 октября 2022 года компания Nvidia выпускает в продажу видеокарту GeForce RTX4090 – одну из лучших моделей своей новой 4000-й серии. Это мощнейшие графические адаптеры, созданные на основе архитектуры Ada Lovelace (Ада Лавлейс). Они имеют беспрецедентную производительность при работе с искусственным интеллектом, обработке 3D-приложений, в играх, многопотоковых вычислениях на GPU.

Почему компания Nvidia назвала архитектуру своих видеокарт именем Ады Лавлейс?

Ada Lovelace Day 2016: Who was Ada Lovelace and why is she still a role  model for women today? - Mirror Online

Ада Лавлейс – это выдающаяся женщина-математик, которая еще в начале XiX века занималась улучшением/программированием вычислительной машины Чарльза Беббиджа, а также ввела в обиход такие термины, как цикл и рабочая ячейка.

В связи с этим Ада Лавлейс считается самым первым известным программистом в истории.

Название «Ада Лавлейс» в новой архитектуре видеокарт NVIDIA продолжает традиции компании по использованию имен выдающихся ученых, сделавших значительный вклад в математике, физике и электротехнике (ранее это были Ферми, Максвелл, Паскаль, Тьюринг, Ампер, Тесла а теперь – Лавлейс).

Какие особенности имеет архитектура Ada Lovelace видеокарт Nvidia?

Архитектура Ada Lovelace видеокарт Nvidia имеет ряд преимуществ в сравнении с предыдущей (Ampere):

  • значительно увеличилось количество транзисторов (вычислительных ядер) на единицу площади. Это позволило поднять частоту их работы и производительность, снизив потребление;
  • используются новые RT-ядра и более быстрая (примерно в два раза) прорисовка тензорных лучей;
  • за счет добавления технологии Shader Execution Reordering увеличена производительность шейдерных ядер, что особенно эффективно проявляется в приложениях/играх, использующих Ray Tracing;

https://img.gigglehd.com/gg/files/attach/images/13773/316/960/012/46b6097a96292d0965ae83282176ce11.jpg

  • добавлена поддержка технологии NVIDIA DLSS 3. Это совершенно новый Optical Flow ускоритель и AI frame генератор, который ускоряет рендеринг в 2-4 раза.

https://img.gigglehd.com/gg/files/attach/images/13773/316/960/012/f262787a952e2c92f1e4b96ac17e22f0.jpg

Полноценный AD102-кристалл содержит:

  • 12 графических кластеров (GPC);
  • 72 текстурных кластера (TPC);
  • 144 стриминговых мультипроцессора (SM). Каждый из них включает 128 CUDA ядер, одно RT ядро, 4 тензорных ядра, 4 текстурных юнита, 256 KB файл регистра и 128 килобайт кеша L1;
  • 288 FP64-битных ядер (по два на один SM);
  • 384-битную шину памяти с 12-ю 32-битными контроллерами.

Блок-схема AD102-чипа со всеми юнитами:

Видеокарта 4000-й серии с «необрезанным» GPU AD102 содержит:

  • 18432 CUDA-ядра;
  • 144 RT-ядра;
  • 576 тензорных ядер;
  • 576 текстурных юнитов.

Один графический кластер видеокарт 4000-й серии (AD10x GPU) включает 6 TPC, 12 SM и 16ROP:

Сравнение чипов AD102 и TU102 (RTX2000-я серия):

https://cdn-ak.f.st-hatena.com/images/fotolife/V/Vengineer/20220923/20220923100820.png

Сравнение чипов AD102 и GA102 (RTX3000-я серия):

https://cdn-ak.f.st-hatena.com/images/fotolife/V/Vengineer/20220923/20220923101116.png

Какие технические характеристики имеет видеокарта NVIDIA GeForce RTX 4090?

Технические характеристики графического адаптера NVIDIA GeForce RTX 4090 (в сравнении с графическим адаптером Nvidia GeForce RTX 3090):

  • Дата начала производства — 12.10.2022 (01.09.2020);
  • Графический процессор — AD102-300-A1 (GA102-300-A1);
  • Архитектура — Ada Lovelace (Ampere);
  • Технический процесс, нм — 5 (8);
  • Количество транзисторов, млрд. — 76.3 (28.3);
  • Площадь кристалла, mm² — 608 (628);
  • Количество стриминговых мультипроцессоров (SM Count) — 128 (82);
  • Количество шейдерных ядер (Shading Units) — 16384 (10496);
  • Количество блоков TMU/ROP — 512/192 (328/112);
  • Частота работы GPU, МГц — 2235-2520 (1395-1695);
  • Производительность FP32, TFLOPS — 82.58 (35.58);
  • Производительность FP64, GFLOPS — 1290 (556);
  • Объем видеопамяти, GB — 24;
  • Тип видеопамяти — GDDR6X;
  • Тактовая частота памяти, МГц/эффективная частота, Gbps — 1325/21.2 (1219/19.5);
  • Разрядность шины памяти, бит — 384;
  • Кеш L2/L3, MB — 96/- (6/-);
  • Полоса пропускания памяти, GB/s — 1018 (936.2);
  • Поддержка CUDA/OPENCL — 8.9/3.0 (8.6/3.0);
  • Теоретический хешрейт на алгоритме ethash, MH/s (согласно производительности VRAM) — 127 (117);
  • TDP, ватт — 450 (350);
  • Теоретическая энергоэффективность, MH/s на ватт, не хуже 0.28 (0.33).

GPU 4000-й серии созданы по 5-нм технологическому процессу (TSMC 4N), что является серьезным шагом вперед по сравнению с видеокартами Ampere трехтысячной серии, которые создавались по 8-нм технологии.

В технологическом процессе TSMC 4N используется именно 5-нм размер полупроводниковых кристаллов, но с различными улучшениями в сравнении с эпохой 5N (настоящий 4-нм процесс будет называться TSMC N4).

Интересно отметить, что на GeForce RTX 4090 используется только 128 SM-ядер из максимально возможных 144. Таким образом, через некоторое время должны появиться видеокарты GeForce RTX 4090Ti/Titan со всеми 144 стримиинговыми процессорами. Производительность титановой видеокарты при вычислениях будет на 10-15% выше обычной модели.

Размер быстродействующего кеша L2 на GeForce RTX 4090 увеличился в 16 раз – с 6 до 96 мегабайт!

Вероятно, это связано с необходимостью ответить на преимущества видеокарт AMD, связанные с технологией Infinity Cash/Smart Access Memory.

Какие аппаратные особенности имеют видеокарты NVIDIA GeForce RTX 4090?

Для использования видеокарт NVIDIA четырехтысячной серии, в частности, GeForce RTX 4090, нужно использовать драйвера:

  • на компьютерах под управлением Windows – не старее версии 522.06;
  • на PC под Linux – 520.61.05 или новее.

Видеокарты NVIDIA GeForce RTX 4000-й серии имеют аппаратную поддержку compute capability 9.0 (видеокарты NVIDIA Hopper и NVIDIA Ada Lovelace), реализованную в CUDA Toolkit начиная с версии 11.8.

В них используется улучшенный алгоритм взаимодействия с центральным процессором компьютера, оптимизирована работа мультипроцессорной системы, а также ряд других улучшений:

https://developer-blogs.nvidia.com/wp-content/uploads/2022/09/cuda-upgrade-path-jetson.png

Для питания RTX4090 Founders Edition используется 12-pin коннектор (Molex Micro-Fit 3.0) дополнительного питания:

Назначение коннекторов разъема дополнительного питания RTX4000-х аналогично схеме, опробованной на референсных RTX3000:

https://pactech-inc.com/wp-content/uploads/2020/11/12-pin-GPU-Cable.jpg

Теоретически через разъем Molex Micro-Fit 3.0 при использовании проводов 16AWG может подаваться до 600 ватт мощности. Для RTX4090 могут использоваться переходники с проводами 18AWG, которые обеспечивают передачу 500 ватт мощности.

Так как 4090-я кушает не более 450 ватт, то при использовании 12-пинового коннектора по линии дополнительного питания обеспечивается хороший запас. В связи с этим некоторые производители видеокарт могут использовать на своих изделиях по два 6+2-pin стандартных разъема питания, способные выдать до 450 ватт мощности (два по 225w).

Для подключения GeForce RTX4090 к блоку питания нужно использовать переходники с 3-4 ответвлениями на коннекторы 6+2 pin, так как в случае использования переходников с двумя ответвлениями через провода/места соединений контактов будет проходить слишком большой ток.

Различия между мощным 450-ваттным (слева) и более слабым 350-ваттным (справа) переходниками питания мощных 12-пиновых видеокарт:

В системе питания типовых видеокарт Nvidia RTX 4090 используется 23 фазы питания, что обеспечивает очень стабильную работу:

https://img.gigglehd.com/gg/files/attach/images/13773/316/960/012/c450d08daf0ec7cdd0f2b3f561ed94d1.jpg

Какой хешрейт могут обеспечить видеокарты Nvidia 4000-й серии и стоит ли их покупать для майнинга?

Учитывая высочайший уровень производительности видеокарт Nvidia GeForce RTX4000-й серии, они смогут обрадовать своим хешрейтом даже требовательных майнеров. На алгоритме ethash эти видеокарты могут выдавать до 130-135 MH/s.

Для полноценного использования их возможностей желательно использовать программы, скомпилированные с поддержкой compute capability 9.0 (CUDA Toolkit 11.8 и новее).

Хешрейт видеокарт Nvidia GeForce RTX 4090 при майнинге:

  • autolykos v2 (ERGO) – 260-280 MH/s (lolminer 1.60);
  • GrinCuckatoo31/32  – 3-4 G/s;
  • CuckooCycle – 13-14 G/s;
  • kaspa – 2.2 GH/s (lolminer 1.60);
  • equihash 125.4 (FLUX) – 145-150 sol/s (miniz 1.9z3);
  • equihash 144.5 (zhash) – 200 sol/s (miniz 1.9z3);
  • ethash/etchash – 130-140 MH/s;
  • kawpow – 60-70 MH/s (gminer 3.07);
  • octopus – 190 MH/s;
  • sha512256d – 3.5-3.8 GH/s (Radiator1.0.0).

В связи с тяжелой ситуацией, сложившейся в мире в настоящее время, покупка видеокарт уровня Nvidia GeForce RTX4090 для майнинга представляется (мягко говоря) не очень разумным вложением средств.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *