
Ошибка температуры видеокарты 511C и как с ней бороться
При эксплуатации компьютера (чаще с видеокартами AMD, реже с Nvidia) иногда возникает ошибка, при которой отображается фантастическая температура GPU, равная 511C.
При этом приложение (например, майнер) завершает свою работу, сообщая Autofan GPU temperature 511 is unreal, driver error:

Как правило, ошибка появляется не сразу после включения компьютера, а спустя некоторое время, после продолжительной работы (иногда несколько часов или суток) под высокой нагрузкой.
Из-за чего возникает ошибочное сообщение о перегреве видеокарты?
Error 511C обычно связана с переразгоном, нехваткой мощности, потребляемой GPU, либо другими нарушениями, приводящими к ошибкам при получении данных от контроллера температуры. В этом случае устройство начинает работать некорректно, отображается аномально высокая температура, хотя на самом деле перегрева графического адаптера нет.
Микросхемы, измеряющие температуру (Thermal Sensor), использующиеся на видеокартах, обычно могут измерять температуру в пределах от минус 40 до плюс 125C. Выход за эти пределы является ошибкой, что приводит к появлению ошибки драйвера/error 511C (или 951F).

Для питания контроллеров температуры обычно используется вольтаж 3.3 вольта. На его основе формируются логические сигналы, соответствующие температуре, измеренной сенсором (встроенным в контроллер или удаленном). Если питающее напряжение не соответствует норме, либо на контроллер приходит некорректный сигнал от сенсора, может появиться ошибка.
Температуре 511°C соответствует двоичное число 11111111, которое не входит в стандартный диапазон значений, заложенный в регистры контроллера.
Таблица соответствия температуры и двоичного кода (8-битный формат) для контроллера температуры TMP451:

Как избавиться от ошибки GPU temperature 511 is unreal?
Ошибка 511°, связанная с неверным отображением температуры видеокарты, часто связана с неспособностью блока питания компьютера обеспечить необходимое напряжение/мощность, либо с повреждением (подгоранием) проводников/разъемов питания.

Для точной диагностики причины неисправности желательно измерить напряжения по всем линиям питания видеокарты/райзера.
Если они значительно отклоняются от нормы, то проблема именно в этом (лечится заменой блока питания на заведомо исправный).
В некоторых случаях причиной проблемы является сильная просадка напряжения по фазе 220-230 вольт (причиной может быть неравномерная нагрузка по фазам, либо проблемы с проводкой, некачественным соединением блока питания с питающей сетью).

Если используются переходники/разветвители и/или блок питания с модульными разъемами (отстегивающимися проводами), нужно внимательно проверить все соединения, провода, коннекторы и разъемы на наличие оплавлений, подгораний и надежность электрического контакта.
Некачественное электрическое соединение на высоконагруженной линии быстро приводит к перегреву места соеднения с большим сопротивлением и оплавлению изоляции/пластмассовых частей разъема:

Часто подобная проблема возникает при использовании райзеров, запитанных через разъемы SATA (Pмакс по линии +12 вольт- до 54 ватт, +5V до 22W, +3.3V — до 14.85 ватт) или MOLEX (+12 вольт- до 60 ватт, +5V до 25W,). В них больше вероятность ухудшения электрического контакта из-за больших токов, проходящих через маленькую площадь контакта.
Реже проблема возникает на райзерах с 6-пиновыми разъемами питания +12V, так как в них нагрузка на коннекторы более щадящая, допускает Pмакс до 75 ватт.
Плохой контакт со временем обязательно приведет к проблемам:

Кроме того, причиной проблемы может стать плохой контакт/некачественный кабель USB, соединяющий райзер и материнскую плату (в этом случае проблему вызывает сбой по линиям приема-передачи шины PCI-E).
Ошибка с отображением температуры может возникнуть и на компьютере, на котором не используются райзера. В этом случае причиной проблемы может быть плохой контакт в разъеме PCI-E материнской платы (например, из-за некорректной установки, окисления/подгорания контактов).


