
О видеокартах NVIDIA 4000-й серии
С 12 октября 2022 года компания Nvidia выпускает в продажу видеокарту GeForce RTX4090 – одну из лучших моделей своей новой 4000-й серии. Это мощнейшие графические адаптеры, созданные на основе архитектуры Ada Lovelace (Ада Лавлейс). Они имеют беспрецедентную производительность при работе с искусственным интеллектом, обработке 3D-приложений, в играх, многопотоковых вычислениях на GPU.
Почему компания Nvidia назвала архитектуру своих видеокарт именем Ады Лавлейс?
Ада Лавлейс – это выдающаяся женщина-математик, которая еще в начале XiX века занималась улучшением/программированием вычислительной машины Чарльза Беббиджа, а также ввела в обиход такие термины, как цикл и рабочая ячейка.
В связи с этим Ада Лавлейс считается самым первым известным программистом в истории.
Название «Ада Лавлейс» в новой архитектуре видеокарт NVIDIA продолжает традиции компании по использованию имен выдающихся ученых, сделавших значительный вклад в математике, физике и электротехнике (ранее это были Ферми, Максвелл, Паскаль, Тьюринг, Ампер, Тесла а теперь – Лавлейс).
Какие особенности имеет архитектура Ada Lovelace видеокарт Nvidia?
Архитектура Ada Lovelace видеокарт Nvidia имеет ряд преимуществ в сравнении с предыдущей (Ampere):
- значительно увеличилось количество транзисторов (вычислительных ядер) на единицу площади. Это позволило поднять частоту их работы и производительность, снизив потребление;
- используются новые RT-ядра и более быстрая (примерно в два раза) прорисовка тензорных лучей;
- за счет добавления технологии Shader Execution Reordering увеличена производительность шейдерных ядер, что особенно эффективно проявляется в приложениях/играх, использующих Ray Tracing;
- добавлена поддержка технологии NVIDIA DLSS 3. Это совершенно новый Optical Flow ускоритель и AI frame генератор, который ускоряет рендеринг в 2-4 раза.
Полноценный AD102-кристалл содержит:
- 12 графических кластеров (GPC);
- 72 текстурных кластера (TPC);
- 144 стриминговых мультипроцессора (SM). Каждый из них включает 128 CUDA ядер, одно RT ядро, 4 тензорных ядра, 4 текстурных юнита, 256 KB файл регистра и 128 килобайт кеша L1;
- 288 FP64-битных ядер (по два на один SM);
- 384-битную шину памяти с 12-ю 32-битными контроллерами.
Блок-схема AD102-чипа со всеми юнитами:
Видеокарта 4000-й серии с «необрезанным» GPU AD102 содержит:
- 18432 CUDA-ядра;
- 144 RT-ядра;
- 576 тензорных ядер;
- 576 текстурных юнитов.
Один графический кластер видеокарт 4000-й серии (AD10x GPU) включает 6 TPC, 12 SM и 16ROP:
Сравнение чипов AD102 и TU102 (RTX2000-я серия):
Сравнение чипов AD102 и GA102 (RTX3000-я серия):
Какие технические характеристики имеет видеокарта NVIDIA GeForce RTX 4090?
Технические характеристики графического адаптера NVIDIA GeForce RTX 4090 (в сравнении с графическим адаптером Nvidia GeForce RTX 3090):
- Дата начала производства — 12.10.2022 (01.09.2020);
- Графический процессор — AD102-300-A1 (GA102-300-A1);
- Архитектура — Ada Lovelace (Ampere);
- Технический процесс, нм — 5 (8);
- Количество транзисторов, млрд. — 76.3 (28.3);
- Площадь кристалла, mm² — 608 (628);
- Количество стриминговых мультипроцессоров (SM Count) — 128 (82);
- Количество шейдерных ядер (Shading Units) — 16384 (10496);
- Количество блоков TMU/ROP — 512/192 (328/112);
- Частота работы GPU, МГц — 2235-2520 (1395-1695);
- Производительность FP32, TFLOPS — 82.58 (35.58);
- Производительность FP64, GFLOPS — 1290 (556);
- Объем видеопамяти, GB — 24;
- Тип видеопамяти — GDDR6X;
- Тактовая частота памяти, МГц/эффективная частота, Gbps — 1325/21.2 (1219/19.5);
- Разрядность шины памяти, бит — 384;
- Кеш L2/L3, MB — 96/- (6/-);
- Полоса пропускания памяти, GB/s — 1018 (936.2);
- Поддержка CUDA/OPENCL — 8.9/3.0 (8.6/3.0);
- Теоретический хешрейт на алгоритме ethash, MH/s (согласно производительности VRAM) — 127 (117);
- TDP, ватт — 450 (350);
- Теоретическая энергоэффективность, MH/s на ватт, не хуже 0.28 (0.33).
GPU 4000-й серии созданы по 5-нм технологическому процессу (TSMC 4N), что является серьезным шагом вперед по сравнению с видеокартами Ampere трехтысячной серии, которые создавались по 8-нм технологии.
В технологическом процессе TSMC 4N используется именно 5-нм размер полупроводниковых кристаллов, но с различными улучшениями в сравнении с эпохой 5N (настоящий 4-нм процесс будет называться TSMC N4).
Интересно отметить, что на GeForce RTX 4090 используется только 128 SM-ядер из максимально возможных 144. Таким образом, через некоторое время должны появиться видеокарты GeForce RTX 4090Ti/Titan со всеми 144 стримиинговыми процессорами. Производительность титановой видеокарты при вычислениях будет на 10-15% выше обычной модели.
Размер быстродействующего кеша L2 на GeForce RTX 4090 увеличился в 16 раз – с 6 до 96 мегабайт!
Вероятно, это связано с необходимостью ответить на преимущества видеокарт AMD, связанные с технологией Infinity Cash/Smart Access Memory.
Какие аппаратные особенности имеют видеокарты NVIDIA GeForce RTX 4090?
Для использования видеокарт NVIDIA четырехтысячной серии, в частности, GeForce RTX 4090, нужно использовать драйвера:
- на компьютерах под управлением Windows – не старее версии 522.06;
- на PC под Linux – 520.61.05 или новее.
Видеокарты NVIDIA GeForce RTX 4000-й серии имеют аппаратную поддержку compute capability 9.0 (видеокарты NVIDIA Hopper и NVIDIA Ada Lovelace), реализованную в CUDA Toolkit начиная с версии 11.8.
В них используется улучшенный алгоритм взаимодействия с центральным процессором компьютера, оптимизирована работа мультипроцессорной системы, а также ряд других улучшений:
Для питания RTX4090 Founders Edition используется 12-pin коннектор (Molex Micro-Fit 3.0) дополнительного питания:
Назначение коннекторов разъема дополнительного питания RTX4000-х аналогично схеме, опробованной на референсных RTX3000:
Теоретически через разъем Molex Micro-Fit 3.0 при использовании проводов 16AWG может подаваться до 600 ватт мощности. Для RTX4090 могут использоваться переходники с проводами 18AWG, которые обеспечивают передачу 500 ватт мощности.
Так как 4090-я кушает не более 450 ватт, то при использовании 12-пинового коннектора по линии дополнительного питания обеспечивается хороший запас. В связи с этим некоторые производители видеокарт могут использовать на своих изделиях по два 6+2-pin стандартных разъема питания, способные выдать до 450 ватт мощности (два по 225w).
Для подключения GeForce RTX4090 к блоку питания нужно использовать переходники с 3-4 ответвлениями на коннекторы 6+2 pin, так как в случае использования переходников с двумя ответвлениями через провода/места соединений контактов будет проходить слишком большой ток.
Различия между мощным 450-ваттным (слева) и более слабым 350-ваттным (справа) переходниками питания мощных 12-пиновых видеокарт:
![]() |
![]() |
В системе питания типовых видеокарт Nvidia RTX 4090 используется 23 фазы питания, что обеспечивает очень стабильную работу:
Какой хешрейт могут обеспечить видеокарты Nvidia 4000-й серии и стоит ли их покупать для майнинга?
Учитывая высочайший уровень производительности видеокарт Nvidia GeForce RTX4000-й серии, они смогут обрадовать своим хешрейтом даже требовательных майнеров. На алгоритме ethash эти видеокарты могут выдавать до 130-135 MH/s.
Для полноценного использования их возможностей желательно использовать программы, скомпилированные с поддержкой compute capability 9.0 (CUDA Toolkit 11.8 и новее).
Хешрейт видеокарт Nvidia GeForce RTX 4090 при майнинге:
- autolykos v2 (ERGO) – 260-280 MH/s (lolminer 1.60);
- GrinCuckatoo31/32 – 3-4 G/s;
- CuckooCycle – 13-14 G/s;
- kaspa – 2.2 GH/s (lolminer 1.60);
- equihash 125.4 (FLUX) – 145-150 sol/s (miniz 1.9z3);
- equihash 144.5 (zhash) – 200 sol/s (miniz 1.9z3);
- ethash/etchash – 130-140 MH/s;
- kawpow – 60-70 MH/s (gminer 3.07);
- octopus – 190 MH/s;
- sha512256d – 3.5-3.8 GH/s ( ).
В связи с тяжелой ситуацией, сложившейся в мире в настоящее время, покупка видеокарт уровня Nvidia GeForce RTX4090 для майнинга представляется (мягко говоря) не очень разумным вложением средств.

