Железо

Поиск и устранение неисправностей видеокарт

Любое оборудование, каким бы оно ни было надежным, рано или поздно начинает сбоить или полностью выходит из строя. Видеокарты – это достаточно сложное оборудование, начиненное множеством микроэлектронных компонентов, также не являются исключением из этого правила.

При нарушении условий эксплуатации, постоянных нагрузках, близких к критическим, некачественном питании, слишком сильном разгоне, вероятность появления неисправностей видеокарт возрастает в разы. Из-за проблем с видеокартой появляются сложности с загрузкой, на дисплее наблюдаются артефакты, полосы и другой шум, которые приводят к полной или частичной потере работоспособности всего компьютера.

В данной статье рассматриваются типичные неисправности, возникающие у видеокарт как при майнинге, так и при обычной/игровой эксплуатации. Часть из них можно устранить самостоятельно (обычно это проблемы, связанные с некорректной установкой драйверов и переразгоном/даунвольтингом), другая часть требует проведения квалифицированного ремонта, а в некоторых, тяжелых случаях, проведение ремонта нецелесообразно (дешевле купить новую видеокарту).

Синий экран BSOD, связанный с ошибкой VIDEO SCHEDULER INTERNAL ERROR после пролива жидкости из водяной системы охлаждения на GPU и вызванных этим замыканий:

Характерные неисправности видеокарт

Обычно при наличии проблем с видеокартами у компьютера появляются следующие неприятные симптомы:

  1. Появление синих экранов смерти (Video Failure BSOD) при загрузке, работе, а также выходе компьютера из состояний standby/sleep.
  2. Появление на мониторе артефактов на этапе загрузки BIOS, при работе в Windows/других операционных системах, при перегреве карты в результате нагрузки или после включения программы разгона.
  3. Полная невозможность загрузить компьютер. При загрузке и/или работе компьютер полностью зависает, Windows постоянно перезагружается, появляются критические ошибки.
  4. На мониторе нет изображения, хотя дисплей исправен. Компьютер включается, но монитор на это не реагирует и ведет себя так, будто к нему вообще не подключен источник сигнала. Обычно это случается при полном выходе видеокарты из строя, либо исправности кабелей передачи видеосигнала и/или питания.

Причины появления неисправностей у видеокарт

К основным причинам появления проблем в работе видеокарт относятся:

  1. Некорректная работа драйверов/программного обеспечения (наличие багов или проблем с совместимостью).
  2. Аппаратные проблемы (Hardware Failures). К ним относятся:
  • заводские дефекты печатной платы (PCB board);
  • некачественная пайка (отсутствие и/или лишние контакты/короткие замыкания);
  • выход из строя пассивных электронных элементов (конденсаторов, дросселей, резисторов, диодов, коннекторов и т.д.) из-за перегрева, бросков тока, неправильной регулировки напряжений, при слишком большом разгоне и т.д.;
  • сгорание/пропадание контакта у активных электронных компонентов видеокарты: чипа, микросхем памяти, ШИМ-контроллеров, транзисторов;
  • повреждение микросхемы BIOS (аппаратное или программное).

Чтобы понять, программная или аппаратная ошибка приводит к сбоям в работе видеокарты, можно использовать один из следующих способов:

  • загрузить компьютер в другой операционной системе, например, использовать LiveCD на отдельном USB/HDD/CD/DVD, либо флешку с дистрибутивом xubuntu;
  • переустановить ОС;
  • заново установить/переустановить драйвера;
  • откатиться на старую, проверенную версию драйверов;
  • восстановить ОС из резервного хранилища или обновить ее на более новую версию.

Если после использования указанных способов проблемы в работе GPU остаются, то их причина кроется в физической неисправности видеокарты

Проблемы с работой драйверов обычно лечатся их чистой переустановкой по методике, изложенной в статье «Правильная установка драйверов GPU для майнинга».

Иногда проблема переустановкой драйверов не решается, и приходиться заново устанавливать систему. В этом случае желательно ее оптимизировать, воспользовавшись советами из статьи «Как выбрать дистрибутив Windows и настроить систему для майнинга».

Если переустановка драйверов/системы не помогает, то нужно переходить к поиску аппаратных проблем.

Для того, чтобы удостовериться в том, что у видеокарты имеется именно физическая неисправность можно использовать следующие способы:

  • попробовать запустить проблемную видеокарту в другом слоте PCI-E материнской платы;
  • произвести проверочный запуск ВК на другом компьютере, с другим блоком питания;
  • заменить райзера, кабеля питания и сигнальный кабель на заведомо исправные.

Если при запуске ВК на другом компьютере появляются те же признаки неисправности, или он вообще не запускается, то причина, скорее всего, заключается в физической неисправности GPU.

Если видеокарточка исправна, но в нее залит неправильный BIOS, то нужно вставить ее в качестве второй (не основной), запустить компьютер и проверить, определяется ли она в диспетчере устройств.

Ошибка 43 свидетельствует о проблемах с BIOS-ом и может быть вылечена пропатчиваением драйверов или прошивкой правильного BIOS с помощью AtiFlash или программатор.

Если система показывает ошибку 12 (нехватка ресурсов), то можно поколдовать в BIOS материнской платы, отключив там все лишнее оборудование (звуковая карта, неиспользуемые порты и т.д.).

Если система с проблемной видеокартой начинает загружаться, но при этом возникает ошибка с синим экраном, нужно внимательно изучить ее код, отображаемый на экране. Например, при появлении ошибки VIDEO TDR FAILURE у видеокарт система сама указывает сбойный модуль, являющийся виновником проблем.

Пример ошибки VIDEO TDR FAILURE видеокарт Nvidia, возникающей из-за проблем с файлом nvlddmkm.sys:

Проблема с файлом nvlddmkm.sys, а также код BSOD ошибки stop 0x00000116 обычно решается переустановкой драйверов.

При несоответствии установленной версии CUDA некоторые программы могут не запускаться, выдавая соответствующую ошибку. Выбрать нужную версию платформы CUDA в драйверах Nvidia можно руководствуясь информацией из статьи «О технологии многопотоковых вычислений CUDA в видеокартах компании Nvidia».

Ошибка NVML: cannot get fan speed, error 999 лечится по методике, изложенной в статье «Как исправить ошибку NVML cannot get fan speed».

Решить проблемы, вызывающие ошибку «NVIDIA NVML library not found», поможет информация из статьи «Как исправить ошибку NVIDIA NVML library not found».

Если видеокарта еще «дышит», но на экране появляются артефакты, либо при майнинге появляется много режектов/hardware errors по памяти, немного продлить ее жизнь без замены чипов памяти может снижение разгона, вплоть до снижения частоты памяти ниже штатной.

Ошибки, связанные с деградацией полупроводниковых элементов ядра и памяти диагностируются утилитами, запускающими стресс-тесты на GPU, например, FurMark, а также майнерами, интенсивно использующими видеопамять, например, Клеймором. Снижение рабочей частоты памяти/ядра поможет избавиться и от некоторых синих экранов, связанных с переразгоном/излишним снижением напряжения.

Решение аппаратных проблем с видеокартами обычно требует вмешательства квалифицированного мастера. Иногда решить проблемы с плохими контактами помогает очистка разъемов ваткой/тампоном со спиртом/бензином «Калоша».

В большинстве случаев найти аппаратную проблему невозможно без разборки видеокарты и внимательного осмотра всех ее деталей.

Видеокарта, работавшая долгое время при повышенной влажности имеет следы ржавчины на болтах крепления. Качество всех электрических контактов на этой карте со временем падает:

Визуальный осмотр должен проводиться в первую очередь при подозрении на наличие аппаратных проблем у GPU.

Сгоревшие smd-конденсаторы на видеокарте, выявить которые помог внимательный осмотр платы:

Провести несложную диагностику аппаратных поломок видеокарт AMD могут помочь статьи «Диагностика типовых поломок видеокарт AMD Radeon RX» и «Устранение типичной неисправности в цепи питания Sapphire Radeon RX400/500-й серий».

Если видеокарта работает нестабильно, при этом есть уверенность в драйверах и операционной системе, снижен до минимума разгон и обеспечено качественное питание, проблема может быть в контактах чипов памяти с платой или в некачественном контакте с платой выводов видеопроцессора. Реболлинг и/или замена чипов, практикующиеся в таких случаях обычно стоят очень дорого. Поэтому в большинстве таких случаев выгоднее использовать такую карту в качестве донора для ремонта более «легких» пациентов. Прогревание видеокарт с такими проблемами может кратковременно вернуть их к жизни, но все равно они очень быстро перейдут в мир иной.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

English EN French FR German DE Russian RU Spanish ES