Майнинг

Устранение ошибок при майнинге, связанных с неверной установкой или конфигурированием видеокарт

При настройке и эксплуатации оборудования для майнинга часто возникают различные ошибки.

В данной статье рассматриваются характерные ошибки, возникающие при майнинге при неверной сборке майнинг ферм или в связи с программными ошибками.

Аппаратные ошибки, приводящие к неверной работе или отсутствии видеокарт в диспетчере задач

На аппаратном уровне к ошибкам в определении видеокарт или к постоянному их вылету при работе приводят некоторые часто встречающиеся проблемы. К ним относятся:

  • слабые блоки питания, которые не могут обеспечить достаточной мощности для видеокарт при майнинге. Нужно понимать, что различные блоки питания имеют граничные показатели эффективности и могут выдавать в круглосуточном режиме только ограниченную мощность. Для качественных БП это до 80% от их заявленной мощности, а для дешевых – от 50 до 70% от паспортных данных по линии 12 вольт;
  • некачественные райзера. При использовании райзеров с плохими контактами (как по линии питания, так и по линии данных), с конденсаторами малой емкости, некачественными кабелями USB, видеокарты могут не определяться совсем, либо определяться системой, но вылетать при работе майнера. Для устранения проблем, связанных с райзерами, нужно выбирать только качественные райзера, желательно с 6-пиновым разъемом питания (в крайнем случае Molex), использовать по возможности самые короткие, толстые, экранированные USB-кабеля данных;
  • иногда пользователи забывают подключить все разъемы питания к видеокарте и к райзеру. В этом случае видеокарта может и определяться, но будет отображаться в диспетчере устройств с ошибками;
  • при подключении нескольких блоков питания к майнинг ферме нужно стараться подключать и видеокарту и ее райзер к одному блоку питания. Ни в коем случае нельзя подключать к материнской плате питание от разных блоков питания. Это гарантированно приведет к появлению перетоков и выгоранию электронных элементов платы.

Во всех случаях, связанных с поиском неисправностей в работе электро и радиоаппаратуры и вычислительной техники нужно помнить, что:

ОСНОВНЫМИ ПРИЧИНАМИ НЕИСПРАВНОСТЕЙ В ЛЮБЫХ ЭЛЕКТРИЧЕСКИХ УСТРОЙСТВАХ ЯВЛЯЮТСЯ НАЛИЧИЕ ЛИШНИХ ИЛИ ОТСУТСТВИЕ НУЖНЫХ КОНТАКТОВ.

Программные ошибки, связанные с видеокартами, приводящие к сбоям майнеров

При неверной настройке операционной системы, сбое в установке драйверов, неправильной конфигурации майнеров, избыточном разгоне возникают ошибки, в результате которых происходит сбой при запуске программы-майнера.

Ошибки, вызванные неправильной установкой драйверов

Для правильной установки драйверов видеокарт АМД и Нвидиа рекомендуем почитать статью «Правильная установка драйверов GPU для майнинга», а также профильные форумы.

Как правило, в майнинг фермах с несколькими видеокартами возникают следующие ошибки, связанные с неправильной установкой драйверов:

  1. Ошибка с кодом 43 (error 43) – при установке драйверов АМД на видеокарты с перепрошитым BIOS. Эта ошибка легко лечится с помощью патчера AMD/ATI Pixel Clock Patcher. В операционной системе Windows 7 при установке более четырех видеокарт такая ошибка может возникнуть и с непрошитыми картами. Для ее устранения нужно применять 6xGPU_mod, последнюю версию которого можно скачать на Bitcointalk.

Ошибка с кодом 43, как правило, возникает при установке новых драйверов в системе, что может сделать и сама система во время автоматической установки обновлений. Кроме того, драйвера могут слететь при сбоях в питании, появлении ошибок на носителе системы, воздействии вирусов и других проблемах.

После такого обновления может появиться ошибка 43, а также значительно упасть хешрейт видеокарт. Для видеокарт AMD после установки драйверов нужно применить AMD-Compute-Switcher, а для видеокарт Нвидиа включить P0 state согласно методике, описанной в статье «Оптимизация потребления видеокарт Nvidia при майнинге».

Если после применения патчера и мода (для Windows 7) и перезагрузки системы ошибка не исчезает, то возможно на видеокарте прошит неверный BIOS, произошел сбой при его записи, либо вышла из строя микросхема BIOS на видеокарте. Для устранения такой ошибки нужно:

  • прошить верный BIOS (вернуть заводской)$
  • повторить заново процесс прошивки и дождаться сообщения программы AtiFlash об успехе;
  • переключиться на резервный Bios (при наличии такового).

При невозможности восстановить рабочее состояние видеокарты прошивкой верного Биоса или переключением переключателя BIOS на резерв нужно менять чип BIOS в сервис-центре, либо искать другую причину неполадок.

  1. Ошибка с кодом 12, которая обозначает нехватку ресурсов в системе. Для ее устранения нужно проверить настройки BIOS материнской платы, где нужно:
  • отключить все лишнее (например, serial и parallel port);
  • включить above 4g декодирование;
  • попробовать переключить систему в режим multi GPU;
  • включить/выключить внутреннюю видеокарту (на разных системах этот способ действует по разному);
  • установить режим работы PCI-E устройств в Gen 1 или 2;
  • попробовать обновить BIOS материнской платы на самый последний.

Ошибки в конфигурации майнера при указании видеокарт

Этот вид ошибок возникает в случае отсутствия или неправильного указания в пакетном файле для запуска майнинга видеокарт, которые должны осуществлять майнинг (как АМД, так и Nvidia).

Например, в программе claymore dual miner и других программах от этого программиста, иногда возникает ошибка NO AMD OPENCL found. Она появляется при запуске программы для майнинга и обозначает, что не найдено устройств, поддерживающих технологию OPENCL. В разных программах она может иметь различное написание, но ее суть сводится к невозможности найти подходящее для майнинга устройство. При отсутствии аппаратных ошибок и проблем, связанных с неверной установкой драйверов, неисправность нужно искать в конфигурации майнера.

Эта ошибка может возникать и в других программах, использующихся для майнинга. Например, в программе sgminer подобная ошибка называется clDevicesNum returned error, no GPUs usable. При запуске майнера появляется подобное сообщение:

[02:56:02] Started sgminer v0.1.1

[02:56:02] * using Jansson 2.11

[02:56:09] Specified platform that does not exist

[02:56:09] clDevicesNum returned error, no GPUs usable

[02:56:09] Command line options set a device that doesn’t exist

Еще раз повторимся, что если в диспетчере устройств нужные видеокарты отображены корректно и не имеют восклицательных знаков с кодами ошибки, то неправильно сконфигурирован BAT-файл. Это случается в системах с различными типами карт, установленными в системе (например, интегрированная видеокарта плюс видеокарты AMD или одновременное использование GPU от AMD и Nvidia и все три типа устройств вместе). Как правило, для устранения этой ошибки нужно либо правильно указать номера использующихся в майнере видеокарт, либо указать какую платформу (AMD или Nvidia) нужно использовать.

В Claymore-майнере это команда -platform с цифровым значением: 1 – использовать только видеокарты AMD, 2 — только NVIDIA, 3 – использовать и AMD и NVIDIA GPU (по умолчанию в майнере действует команда 3, согласно которой используются оба типа карт).

В Phoenix miner это команды -amd или –nvidia соответственно.

В sgminer (его различных версиях и подобных программах, например, cgminer) в смешанных системах может понадобиться указывать в командной строке параметр —gpu-platform 1 или 2.

Обычно, при отсутствии включенной внутренней видеокарты этот майнер работает без указания этого парметра, но в этом случае иногда может потребоваться использование команды —gpu-platform 0.

Другие ошибки, приводящие к сбоям в работе майнеров

Рассмотрим другие ошибки, которые иногда возникают при работе программ для майнинга:

  • ошибка OpenCL error -4 (0) — cannot create DAG on GPU – эта ошибка в Claymore майнере возникает при майнинге криптовалют на алгоритме Ethash (Ethereum, UBIQ, ETC, MOAC и другие). Для ее устранения нужно увеличить объем доступной виртуальной памяти в системе, а также использовать самые новые версии майнеров, способные работать с последними эпохами DAG;

  • ошибка WATCHDOG: GPU hangs in OpenCL call появляется при переразгоне видеокарт, некачественных райзерах, плохих (очень длинных) соединительных USB-кабелях. Не нужно выжимать из видеокарт все соки, увеличивая частоту памяти и видеоядра, так как простои, вызванные переразгоном, сведут на нет весь доход от такого майнинга. Понять то, где выставлены очень большие значения частоты поможет программа hwinfo, которая показывает ошибки по памяти для видеокарт AMD:

Как правило, при переразгоне по памяти вылетает одна из видеокарт, а при чрезмерном разгоне по ядру (или очень сильном даунвольтинге) компьютер полностью зависает;

  • майнер с GPU от AMD выключается с ошибкой о температуре карты в 511 градусов (на картах Nvidia появляется ошибка NVML: cannot get current temperature, error 15) – эта проблема возникает при плохом контакте видеокарты с райзером, при котором не проходит сигнал о температуре видеокарты либо есть проблемы по линии питания. Нужно поменять райзер и/или USB-кабель, почистить их контакты, а также контакты разъема видеокарты ваткой, смоченной в спирте. Можно попробовать поменять разъем PCI-E на материнке или вставить карту непосредственно в разъем материнской платы. Кроме того, видеокарта может выдавать такую ошибку при слишком большом разгоне/даунволтинге, а также плохом контакте (или слишком большой нагрузке на блок питания) по линии 12 вольт. В этом случае нужно проверить все разъемы питания, подходящие к карте на предмет наличия прогаров, особенно в случае применения различных переходников/разветвителей, а также снизить нагрузку на БП.

Заключение

Майнинг требует наличия определенных знаний, связанных с эксплуатацией вычислительной техники и сетей связи. Это необходимо, потому что знание основ функционирования радиоаппаратуры и каналов связи дает возможность самостоятельно разобраться в причинах появления неполадок и понять, как их можно устранить наиболее рациональным способом.

Знание основ электротехнических цепей поможет избежать ошибок, связанных с навешиванием чрезмерной нагрузки на одну линию (например, более одной видеокарты на линию Molex), что часто приводит к подгоранию контактов или выходу из строя райзеров и видеокарт.

Понимание закона Ома поможет избежать проблем, связанных с использованием переходников с разъема питания SATA на райзера, которое гарантированно приведет к прогоранию контактов и связанным с этим проблемам.

Чем больше человек знает, тем больше он понимает, что знает очень мало или не знает ничего… Процесс поиска истины благотворно воздействует на человеческую карму и дает жизненный опыт, для обретения которого, возможно, мы и живем…