
Дополнительные возможности видеокарт Nvidia, раскрывающиеся с помощью GPU System Processor
Многие видеокарты Nvidia в составе видеочипа имеют ранее незадействовавшийся сопроцессор (GPU System Processor, сокращенно GSP). Его основной задачей является распределение ресурсов между CPU и GPU.
GSP может выполнять некоторые низкоуровневые операции, что позволяет снизить нагрузку на центральный процессор, оптимизировать порядок взаимодействия между GPU и CPU и снизить энергопотребление, что положительно сказывается на общей эффективности работы системы.
Как включить GPU System Processor на видеокарте Nvidia?
Включение в работу GSP вычислительных ядер GSP на некоторых современных видеокартах Nvidia стало возможно после выхода в свет драйверов версии 510.39.01 для операционных систем на ядре Linux (файл /lib/firmware/nvidia/510.39.01/gsp.bin).
В них реализована ограниченная поддержка функций GSP для следующих видеоускорителей Nvidia (GPU product/Device PCI ID):
Tesla T10 /1E37 10DE 1370 NVIDIA T4G /1EB4 10DE 157D Tesla T4 /1EB8 NVIDIA T4 32GB /1EB9 NVIDIA A100-PG509-200 /20B0 10DE 1450 NVIDIA A100-SXM4-40GB /20B0 NVIDIA A100-PCIE-40GB /20B1 10DE 145F NVIDIA A100-SXM4-80GB /20B2 10DE 1463 NVIDIA A100-SXM4-80GB /20B2 10DE 147F NVIDIA A100-SXM4-80GB /20B2 10DE 1484 NVIDIA PG506-242 20B3 /10DE 14A7 NVIDIA PG506-243 20B3 /10DE 14A8 NVIDIA A100-PCIE-80GB /20B5 10DE 1533 NVIDIA PG506-230 /20B6 10DE 1491 NVIDIA PG506-232 /20B6 10DE 1492 NVIDIA A30 /20B7 10DE 1532 NVIDIA A100-PG506-207 /20F0 10DE 1583 NVIDIA A100-PCIE-40GB /20F1 10DE 145F NVIDIA A100-PG506-217 /20F2 10DE 1584 NVIDIA A40 /2235 10DE 145A NVIDIA A16 /25B6 10DE 14A9 NVIDIA A2 /25B6 10DE 157E
На обычных видеокартах Nvidia соответствующий функционал реализуется благодаря технологии Max-Q v4, с помощью командного сопроцессора (CPU Optimizer). Впервые их поддержка реализуется на мобильных видеокартах GeForce RTX Max-Q v4 (например, на адаптерах RTX 3070 Ti и GeForce RTX 3080 Ti для ноутбуков). Со временем список видеокарт Nvidia, на которых реализован функционал Max-Q, будет расширяться.
Включение/выключение опции GSP на видеокартах с архитектурой Turing производится путем установки параметра kernel module в состояние 1 или 0, например:
kernel module parameter NVreg_EnableGpuFirmware=1
Проверить, доступен ли функционал GSP на компьютере под управлением Linux, можно командой:
nvidia-smi -q
Соответствующая информация появится в строке GSP Firmware Version.
На поддерживаемой видеокарте появится строка такого вида:
GSP Firmware Version : 510.39.01
При отсутствии поддержки видеокартой технологии GSP появится сообщение N/A:
Что дает пользователю видеокарт Nvidia функционал GPU System Processor?
Практическая реализация функций GSP будет полезна всем пользователям, так как принесет небольшое увеличение энергоэффективности работы компьютера.
Основной эффект почувствуют геймеры, так как благодаря сопроцессору Max-Q высвободятся ощутимые ресурсы CPU (до 55%).
Дополнительно к этому, благодаря улучшенной технологии New Reflex, искусственному интеллекту и режиму низкой задержки ввода увеличится FPS в играх (до 20%):
Увеличится ли хешрейт видеокарт при майнинге благодаря включению технологии Max-Q/GPU System Processor?
На производительность видеокарт при майнинге вновь появившийся функционал существенного влияния не окажет, так как вычислительные возможности GSP/CPU Optimizer достаточно скромны ввиду небольшого размера соответствующего участка полупроводникового кристалла.
Фрагмент внутренней структуры GPU, на которой красным выделен участок, отвечающий за функции GSP/CPU Optimizer:
Кроме того, работа GPU System Processor требует внедрения соответствующего ограниченного набора команд в код майнеров.
Хотя драйвера версии 510.39.01 под Linux работают на видеокартах Nvidia, начиная с архитектуры Maxwell, поддержка сопроцессора/ GPU System Processor на большинстве видеокарт (даже с архитектурой Turing) пока недоступна.
Пример компьютера с видеокартами Nvidia GTX1660-й серии (архитектура Turing) и GTX1050Ti с драйверами версии 510.39.01 под управлением операционной системы xubuntu 16.04:
Не смотря на повышение версии CUDA с 11.5 на 11.6, прироста хешрейта на драйверах 510.39.01 по сравнению с версией 495.46 не наблюдается.
Иллюстрация разницы в производительности видеокарт Nvidia GTX1660Ti и GTX1660S при майнинге Ethereum:
на драйвере версии 495.46 (CUDA Version 11.5) хешрейт равен 151.8 MH/s:
на драйвере версии 510.39.01 (CUDA Version: 11.6) хешрейт также равен 151.8 MH/s:

