Майнинг,  Статьи

Как устранить ошибку GPU driver error no temps в HIVE OS

Операционная система для майнинга HiveOS отличается высоким уровнем удобства и надежностью благодаря использованию ядра Linux.

Иногда при майнинге возникает ошибка, связанная с отсутствием информации об ошибках драйвера, невозможностью получить информацию о температуре видеокарты, а также проблемах с управлением вентиляторами. При этом работа рига нестабильна, сопровождается зависаниями и перезагрузками:

Она может возникать из-за различных причин, включая переразгон, перегрев, плохой контакт видеокарты с райзером/материнской платой, некорректная установка/”слетание” драйверов, программный/системный сбой и т.д.

Пример ошибки GPU driver error no temps, появляющейся на компьютере под управлением HiveOS при майнинге на видеокартах AMD Radeon RX6600:

Ошибка GPU driver error no temps часто бывает связана с некорректной работой драйвера. При этом в логах (доступны после нажатия на интерактивный текст ошибки в ) можно увидеть информацию о проблемной видеокарте (ее BUS ID, в приведенном ниже примере число 0000.04.00.0, которое соответствует GPU1 на скрине работы майнера выше):

Приведенная в качестве этого примера GPU driver, error no temps ошибка была “вылечена” путем повторной записи образа системы на USB-носитель. Из-за плохого качества флешек, которые подвергаются постоянной нагрузке (запись логов) со временем появляется все большее количество сбоев.

Еще один пример лога, приводящего к сбоям майнера с ошибкой GPU driver, error no temps:

В этом случае проблемы с работой видеокарт AMD Radeon RX580 были вылечены с помощью снижения их температуры (увеличена скорость вращения вентиляторов).

Что делать при появлении ошибки GPU driver error, no temps?

Чтобы точнее узнать причины проблемы, связанной с отсутствием данных о температуре видеокарты, следует ознакомиться с системными логами, а также полным отчетом о работе майнера.

Логи майнера (файл lastrun_noappend.log) обычно находятся в папке /var/log/miner/xxxx/*.log (ознакомиться с ними можно в программе mc), например:

logs image

Просмотр части отчета доступен по команде

tail -n 100 /var/log/miner/название_майнера/lastrun_noappend.log

где 100 – количество последних отображаемых строк отчета майнера о работе.

Главный отчет системы доступен по команде

less /var/log/syslog

При нажатии shift-f будет отображен конец отчета syslog.

Системные загрузочные логи можно просмотреть консольной командой

journalctl -u hive

Чтобы посмотреть сообщения при загрузке системы, текущее состояние ядра или ошибки в драйверах, можно использовать команду

dmesg

Изучение этого файла отчета может помочь устранению множества проблем и ошибок. Фрагмент лога, отображаемого по команде dmesg:

Устранению проблемы, связанной с ошибкой GPU driver, error no temps могут помочь следующие способы:

  • снижение разгона, в особенности по памяти;
  • уменьшение рабочей температуры видеокарты, в особенности в области VRAM. Для этого нужно регулярно проводить чистку карты, а при необходимости – смену термопасты и термопрокладок;
  • проверка/замена райзеров, кабелей подключения к материнской плате, обеспечение хорошего контакта с разъемом PCI-E (использование термоклея, специальных заглушек и т.д.);
  • проверка/замена кабелей питания и их разъемов на следы перегева, потемнения изоляции, ее расплавления ит.д.:

  • проверка файловой системы на ошибки, либо повторная запись образа HiveOS/замена флешки с системой;
  • обновление/откат драйверов, переход на более новую/стабильную версию HiveOS.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *