
Как устранить ошибку GPU driver error no temps в HIVE OS
Операционная система для майнинга HiveOS отличается высоким уровнем удобства и надежностью благодаря использованию ядра Linux.
Иногда при майнинге возникает ошибка, связанная с отсутствием информации об ошибках драйвера, невозможностью получить информацию о температуре видеокарты, а также проблемах с управлением вентиляторами. При этом работа рига нестабильна, сопровождается зависаниями и перезагрузками:
Она может возникать из-за различных причин, включая переразгон, перегрев, плохой контакт видеокарты с райзером/материнской платой, некорректная установка/”слетание” драйверов, программный/системный сбой и т.д.
Пример ошибки GPU driver error no temps, появляющейся на компьютере под управлением HiveOS при майнинге на видеокартах AMD Radeon RX6600:
Ошибка GPU driver error no temps часто бывает связана с некорректной работой драйвера. При этом в логах (доступны после нажатия на интерактивный текст ошибки в ) можно увидеть информацию о проблемной видеокарте (ее BUS ID, в приведенном ниже примере число 0000.04.00.0, которое соответствует GPU1 на скрине работы майнера выше):
Приведенная в качестве этого примера GPU driver, error no temps ошибка была “вылечена” путем повторной записи образа системы на USB-носитель. Из-за плохого качества флешек, которые подвергаются постоянной нагрузке (запись логов) со временем появляется все большее количество сбоев.
Еще один пример лога, приводящего к сбоям майнера с ошибкой GPU driver, error no temps:
В этом случае проблемы с работой видеокарт AMD Radeon RX580 были вылечены с помощью снижения их температуры (увеличена скорость вращения вентиляторов).
Что делать при появлении ошибки GPU driver error, no temps?
Чтобы точнее узнать причины проблемы, связанной с отсутствием данных о температуре видеокарты, следует ознакомиться с системными логами, а также полным отчетом о работе майнера.
Логи майнера (файл lastrun_noappend.log) обычно находятся в папке /var/log/miner/xxxx/*.log (ознакомиться с ними можно в программе mc), например:
Просмотр части отчета доступен по команде
tail -n 100 /var/log/miner/название_майнера/lastrun_noappend.log
где 100 – количество последних отображаемых строк отчета майнера о работе.
Главный отчет системы доступен по команде
less /var/log/syslog
При нажатии shift-f будет отображен конец отчета syslog.
Системные загрузочные логи можно просмотреть консольной командой
journalctl -u hive
Чтобы посмотреть сообщения при загрузке системы, текущее состояние ядра или ошибки в драйверах, можно использовать команду
dmesg
Изучение этого файла отчета может помочь устранению множества проблем и ошибок. Фрагмент лога, отображаемого по команде dmesg:
Устранению проблемы, связанной с ошибкой GPU driver, error no temps могут помочь следующие способы:
- снижение разгона, в особенности по памяти;
- уменьшение рабочей температуры видеокарты, в особенности в области VRAM. Для этого нужно регулярно проводить чистку карты, а при необходимости – смену термопасты и термопрокладок;
- проверка/замена райзеров, кабелей подключения к материнской плате, обеспечение хорошего контакта с разъемом PCI-E (использование термоклея, специальных заглушек и т.д.);
- проверка/замена кабелей питания и их разъемов на следы перегева, потемнения изоляции, ее расплавления ит.д.:
- проверка файловой системы на ошибки, либо повторная запись образа HiveOS/замена флешки с системой;
- обновление/откат драйверов, переход на более новую/стабильную версию HiveOS.

