Статьи

Для чего нужны тензорные ядра видеокарт?

С появлением архитектуры Volta (Tesla V100) в 2017-м году у видеокарт Nvidia появились тензорные ядра (Tensor Cores):

Это специализированные блоки внутри графического процессора (GPU) NVIDIA, предназначенные для ускорения вычислений при проведении операций с матрицами и тензорами (математическими объектами, описывающими линейные отношения между векторами, скалярами и другими объектами при смене системы координат).

Наиболее частая операция, которую производят с матрицами, это их перемножение:

Один процессор (или одно шейдерное ядро GPU) обычно производит одну операцию умножения двух чисел за один такт, в то время как тензорное ядро способно производить несколько операций за один такт. Благодаря этому тензорные ядра при проведении матричных операций в разы быстрее и энергоэффективнее по сравнению с обычными.

Благодаря высокой производительности при обработке больших массивов данных тензорные ядра идеально подходят для задач искусственного интеллекта (ИИ), машинного обучения и нейросетей:

Они прекрасно подходят для решения задач в которых нужно быстро перемножать матрицы (выполнять операции типа GEMM — General Matrix Multiply):

Каждое ядро может обработать матрицы размером 4×4 за один такт, используя низкую точность для скорости или высокую для точности (например, видеокарта Nvidia Tesla V100 делает 64 операции FP16 за один цикл):

Есть ли тензорные ядра на видеокартах AMD?

В видеокартах AMD имеется полноценный аналог Tensor Cores — Matrix Cores (матричные ядра). В графических ускорителях производства AMD они впервые появились в 2020-м году на профессиональных видеокартах с CDNA-архитектурой Instinct (MI100).

Сравнение видеокарт Nvidia и AMD в контексте наличия аппаратной поддержки матричных вычислений:

Параметр

NVIDIA

AMD

Комментарий

Название

Tensor Cores (4–5 поколение)

Matrix Cores

Разные имена, фактически одна и та же суть

Основные форматы

FP8, FP6, FP4, BF16, TF32, sparsity

FP8, FP6, BF16, TF32, INT8

AMD догнал и местами обогнал по математическим операциям с низкой точностью

Пиковая производительность

Очень высокая в FP8/FP4

Сопоставимая или выше в FP8

AMD часто лидирует в сырых TFLOPS

Экосистема

CUDA + TensorRT — лидер рынка

AMD поначалу сильно отставала от Nvidia, но технология ROCm сильно улучшилась в 2025–2026 годах

Главная проблема AMD — софт

Доступность в геймерских картах

Да, во всех RTX 20+

Частично (AI Accelerators)

AMD Radeon пока отстаёт в ИИ-задачах

Используются ли тензорные ядра в майнинге?

В майнинге тензорные/матричные ядра пока используются очень мало. Существуют некоторые экспериментальные PoW-криптовалюты, использующие математические операции, которые эффективно выполняются на тензорных ядрах. К ним можно отнести такие экспериментальные проекты, как RoboCoin (алгоритм TensHash), TensorHash AI (THASH) и другие.

Кроме того, тензорные блоки ускоряют вычисления по технологии Zero-knowledge proofs (Polygon, zk-rollups, Starknet и им подобные). Они способны ускорить генерацию/верификацию zk-доказательств с помощью совместного использования обычных CUDA + Tensor Cores.

Нужны ли тензорные ядра видеокарт для игр?

Тензорные ядра в современных играх используются достаточно активно для апскейлинга, генерации кадров и реконструкции лучей. В первую очередь они нужны для повышения FPS и полноценного использования технологии DLSS (Deep Learning Super Sampling), использующейся для Super Resolution (DLSS SR), Frame Generation/Multi Frame Generation (MFG) и Ray Reconstruction.

В последнее время благодаря наличию тензорных блоков реализуются и другие AI-улучшения изображения, например, технологии RTX Neural Shaders (нейросети внутри шейдеров DirectX), Neural Texture Compression/Neural Rendering и DLAA/DLDSR.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *