
Для чего нужны тензорные ядра видеокарт?
С появлением архитектуры Volta (Tesla V100) в 2017-м году у видеокарт Nvidia появились тензорные ядра (Tensor Cores):

Это специализированные блоки внутри графического процессора (GPU) NVIDIA, предназначенные для ускорения вычислений при проведении операций с матрицами и тензорами (математическими объектами, описывающими линейные отношения между векторами, скалярами и другими объектами при смене системы координат).

Наиболее частая операция, которую производят с матрицами, это их перемножение:

Один процессор (или одно шейдерное ядро GPU) обычно производит одну операцию умножения двух чисел за один такт, в то время как тензорное ядро способно производить несколько операций за один такт. Благодаря этому тензорные ядра при проведении матричных операций в разы быстрее и энергоэффективнее по сравнению с обычными.

Благодаря высокой производительности при обработке больших массивов данных тензорные ядра идеально подходят для задач искусственного интеллекта (ИИ), машинного обучения и нейросетей:

Они прекрасно подходят для решения задач в которых нужно быстро перемножать матрицы (выполнять операции типа GEMM — General Matrix Multiply):

Каждое ядро может обработать матрицы размером 4×4 за один такт, используя низкую точность для скорости или высокую для точности (например, видеокарта Nvidia Tesla V100 делает 64 операции FP16 за один цикл):

Есть ли тензорные ядра на видеокартах AMD?
В видеокартах AMD имеется полноценный аналог Tensor Cores — Matrix Cores (матричные ядра). В графических ускорителях производства AMD они впервые появились в 2020-м году на профессиональных видеокартах с CDNA-архитектурой Instinct (MI100).
Сравнение видеокарт Nvidia и AMD в контексте наличия аппаратной поддержки матричных вычислений:
Параметр | NVIDIA | AMD | Комментарий |
|---|---|---|---|
Название | Tensor Cores (4–5 поколение) | Matrix Cores | Разные имена, фактически одна и та же суть |
Основные форматы | FP8, FP6, FP4, BF16, TF32, sparsity | FP8, FP6, BF16, TF32, INT8 | AMD догнал и местами обогнал по математическим операциям с низкой точностью |
Пиковая производительность | Очень высокая в FP8/FP4 | Сопоставимая или выше в FP8 | AMD часто лидирует в сырых TFLOPS |
Экосистема | CUDA + TensorRT — лидер рынка | AMD поначалу сильно отставала от Nvidia, но технология ROCm сильно улучшилась в 2025–2026 годах | Главная проблема AMD — софт |
Доступность в геймерских картах | Да, во всех RTX 20+ | Частично (AI Accelerators) | AMD Radeon пока отстаёт в ИИ-задачах |
Используются ли тензорные ядра в майнинге?
В майнинге тензорные/матричные ядра пока используются очень мало. Существуют некоторые экспериментальные PoW-криптовалюты, использующие математические операции, которые эффективно выполняются на тензорных ядрах. К ним можно отнести такие экспериментальные проекты, как RoboCoin (алгоритм TensHash), TensorHash AI (THASH) и другие.
Кроме того, тензорные блоки ускоряют вычисления по технологии Zero-knowledge proofs (Polygon, zk-rollups, Starknet и им подобные). Они способны ускорить генерацию/верификацию zk-доказательств с помощью совместного использования обычных CUDA + Tensor Cores.

Нужны ли тензорные ядра видеокарт для игр?
Тензорные ядра в современных играх используются достаточно активно для апскейлинга, генерации кадров и реконструкции лучей. В первую очередь они нужны для повышения FPS и полноценного использования технологии DLSS (Deep Learning Super Sampling), использующейся для Super Resolution (DLSS SR), Frame Generation/Multi Frame Generation (MFG) и Ray Reconstruction.
В последнее время благодаря наличию тензорных блоков реализуются и другие AI-улучшения изображения, например, технологии RTX Neural Shaders (нейросети внутри шейдеров DirectX), Neural Texture Compression/Neural Rendering и DLAA/DLDSR.


