В летнее время значительно возрастает количество несчастных случаев, связанных с возгораниями радиоэлектронной техники, проблемами с проводкой и неправильными условиями эксплуатации мощных компьютеров.
Поломки, связанные с излишним нагревом электронных элементов касаются большинства современных устройств, использующих полупроводниковые элементы, так как они работают, используя одни и те же физические законы и рабочие режимы.
Эта тема уже частично рассматривалась в статье «О проблемах, связанных с перегревом вычислительного оборудования». В данной статье снова рассматривается перегрев, как самая частая причина поломок большинства устройств, работающих от электричества.
Почему так опасен перегрев электронных элементов?
В мире электронных компонентов существует правило, согласно которому повышение температуры электронного элемента на 10 градусов по Цельсию ниже порога в 40 C, увеличивает в два раза время наработки на отказ. На английском языке этот параметр называют MTBF (Mean time between failures).
Каждая ступень, равная 10 C, преодоленная выше отметки в 40 градусов сокращает значение MTBF вдвое.
В связи с этим большинство поломок радиоэлектронного оборудования связано именно с работой при повышенной температуре. Это подтверждается тем фактом, что, согласно статистическим данным, наиболее часто ломающимся компонентом компьютера является видеокарта.
Наиболее чаще выходящие из строя из-за перегрева компоненты компьютера:
Чаще всего перегрев электроники происходит в летнее время, когда система охлаждения не справляется с отводом тепла.
Статистические данные по количеству поломок радиоэлектронного оборудования в Японии по месяцам года (источник: портал tsubame):
В связи с важностью недопущения перегрева электронных компонентов, необходимо уделять пристальное внимание работоспособности штатных систем охлаждения, используя для этого не только визуальный осмотр, но и специальные приборы: бесконтактные термометры и тепловизоры.
Польза от тепловизоров при эксплуатации крупных майнинг ферм просто неоценима. Для ознакомления с некоторыми возможностями тепловизоров при майнинге, рекомендуется прочитать статью «Почему нужно сокращать до минимума количество переходников питания в мощных компьютерах».
Как бороться с перегревом оборудования при майнинге?
Борьба с перегревом является действенным способом увеличения продолжительности бесперебойной работы. Эта тема частично поднималась в статье «Как увеличить прибыль от майнинга криптовалют?». Для уменьшения проблем, связанных с перегревом, при эксплуатации мощного вычислительного оборудования необходимо:
- не жалеть ресурса систем охлаждения, использующихся для отвода тепла и охлаждения вычислительного оборудования;
- иметь в достаточном католичестве запасные вентиляторы, подходящие для замены штатных;
- в помещении дата-центра обеспечивать циркуляцию воздуха не менее 300 куб. метров на каждый киловатт потребляемой мощности. Использование кондиционеров при большом тепловыделении требует огромных затрат электроэнергии и лишь увеличивает проблемы, связанные с необходимостью отвода излишнего тепла;
- не оставлять без присмотра работающие дата-центры, обязательно укомплектовать помещение, в котором находятся мощные компьютеры, средствами пожаротушения, подходящими для электрических установок (порошковые огнетушители);
- при наличии достаточной площади желательно расставить оборудование таким образом, чтобы в случае возгорания одного компьютера огонь не передался на соседние;
- при прокладке электрической проводки обязательно использовать третий провод защитного заземления и подключать устройства через защитный автомат + УЗО (дифференциальный автомат). Благодаря этому при расплавлении проводов из-за коротких замыканий/превышении допустимой нагрузки произойдет отключение электричества дифавтоматом;
- обязательно использовать программные методы контроля температуры и управления работой систем охлаждения видеокарт, процессора и других устройств. При этом по возможности стоит включать защиту от перегрева на всех уровнях: в BIOS, в утилитах разгона (например, nvidiainspector), майнере и операционной системе;
- если система охлаждения не справляется с отводом тепла в жаркие часы, лучше настроить автоматическое выключение оборудования или снижение интенсивности его работы в это время. Потери, связанные с выходом из строя дорогостоящих видеокарт из-за перегрева будут неизмеримо большими, чем недополученная прибыль вследствие вынужденного простоя. В крайнем случае можно временно отключать менее производительные видеокарты, а также те из них, которые не справляются с повышенной температурой.
Для обеспечения спокойствия при эксплуатации майнинг-оборудования в жаркую пору года нужно использовать надежные блоки питания.
Использование качественных блоков питания достаточной мощности
Блоки питания являются одними из наиболее важных комплектующих в составе любого компьютера. Они должны обеспечивать качественные питающие напряжения для процессора, чипсета материнской платы, видеокарт, ОЗУ и других компонентов. Разброс выходных напряжений, их форма, величина пульсаций и гармоник не должны выходить за пределы нормы даже при значительных перепадах питающего напряжения.
БП должен быть экономичным, обеспечивать защиту от перенапряжений, коротких замыканий, перегрева и других проблем. В связи с круглосуточной работой майнингового оборудования, немаловажно обеспечить запас мощности блоков питания. Некоторая информация по этой теме есть в статье «Как рассчитать мощность блока питания для майнинг рига?».
Чтобы свести до минимума такие случаи, а также самостоятельно локализовать причину неисправности, стоит разбираться в типичных причинах поломок импульсных блоков питания, использующихся как в обычных в компьютерах, так и для питания оборудования для майнинга.
Дешевые/некачественные источники питания чаще выходят из строя из-за ошибок в проектировании, вследствие некачественной сборки, из-за экономии на электронных элементах. Очень часто при повышенной температуре выходят из строя электролитические конденсаторы, а также ускоряется деградация памяти видеокарт.
При периодической проверке майнингового оборудования стоит уделять внимание не только видеокартам, ASIC-ам, но и блокам питания. Следует обращать внимание на состояние кабелей питания, изменения цвета их изоляции, выявление мест перегрева и плохих контактов. Этого невозможно сделать без использования тепловизора с достаточным разрешением.
Перегрев блоков питания, видеокарт, процессора часто связан с выходом из строя вентиляторов системы охлаждения.
Поломки, связанные с вентиляторами системы охлаждения
Вентиляторы системы охлаждения должны обеспечивать постоянный отвод тепла от электронных компонентов блоков питания. Поломка вентиляторов и связанный с этим перегрев является одной из самых частых причин выхода из строя разных радиоэлектронных устройств, включая БП, видеокарты, процессоры, цепи питания материнских плат и т. д.
Майнерам стоит заблаговременно обзавестись запасными вентиляторами, а также подшипниками для их ремонта. При выборе подшипников стоит ориентироваться на качественные модели с высокой точностью обработки. Они меньше шумят и греются, смазывать их нужно реже, эффективность работы вентилятора с качественными подшипниками выше.
Полезная информация по этой теме есть в статье «Ремонт и профилактика механической части вентиляторов видеокарт», а также «Ремонт вентиляторов с оторванной обмоткой статора».
В летнее время может понадобиться установка дополнительных мощных вентиляторов между видеокартами, либо канальных/стационарных вентиляторов, обеспечивающих отвод теплого/приток чистого и прохладного воздуха.
При их выборе следует ориентироваться а производительность (величину воздушного потока), уровень шума, мощность и удобство эксплуатации.
Наступила июльская жара и нашим железным коням сейчас приходится очень тяжело. Перегрев не только снижает производительности устройства, но и может вывести его из строя. В этом блоге я расскажу о всех действенных способах борьбы с перегревом. Не знаю как у вас, а у меня в комнате температура перевалила за 30 градусов. Уличный кондиционер решил бы проблему, но при выборе комнат, которые будут охлаждаться я уже сделал выбор в пользу пожилых родственников.