Железо,  Статьи

Об отвале BGA чипов на видеокартах и других устройствах

Отвал BGA-чипов со временем неминуем, как неизбежно наступление коммунизма…

Перефразированная цитата «классиков»

При эксплуатации видеокарт, ASIC-ов и другого оборудования в экстремальных условиях, например, при сильных температурных колебаниях, сырости, а также в случае установки на плату бракованных видеочипов/микросхем памяти (или при их некачественной установке/пайке), очень скоро может произойти досадная неисправность – отвал BGA-чипа.

С этой проблемой неизбежно сталкиваются те, кто покупает б/у видеокарты, а также долгое время эксплуатирует майнинговое оборудование.

В связи с этим стоит более глубоко разбираться в диагностике и ремонте неисправностей, связанных с отвалом BGA-чипов.

Из-за чего происходит отвал BGA-чипа у видеокарт?

В современных видеокартах, ASIC-ах, смартфонах очень часто используются микросхемы, электрическое соединение которых с платой устройства производится с помощью многочисленных шариков припоя. Такие чипы называют BGA-микросхемами (аббервиатура от английского словосочетания Ball grid array — массив шариков).

Пример BGA-чипа на печатной плате в разрезе:

В нормальных условиях электрический контакт, образованный шариками припоя очень надежен.

Фотография качественного электрического соединения, образованного припаиванием BGA-шарика к контактным площадкам микросхемы и печатной платы:

Вследствие температурных колебаний и других неблагоприятных условий в процессе эксплуатации устройств с BGA-микросхемами происходит постепенная потеря контакта в месте соединения BGA-шариков с контактными дорожками как внутри корпуса чипа, так и вне его:

В связи с нещадной эксплуатацией видеокарт при майнинге, эта проблема проявляется у них довольно часто. Неисправностям, связанным с отвалом BGA-чипов чаще подвержены видеокарты, долгое время работающие без обслуживания в запыленных помещениях, что приводит к загрязнению системы охлаждения и неблагоприятному температурному режиму.

Отвал BGA-чипов (GPU или VRAM) связан с двумя основными причинами:

  • пропадание электрического контакта между подложкой и полупроводниковым кристаллом внутри чипа — такие неисправности устраняются только заменой чипа;
  • нарушение контакта BGA-микросхемы с печатной платой устройства (BGA solder joint crack) или замыкание между ее контактными шариками (часто происходит вследствие бездумных действий «прогревастов»). Такие неисправности можно устранить с помощью проведения реболлинга чипа.

Проблемы, связанные с плохой пайкой BGA-компонентов связаны со следующими причинами:

  • неправильно подобранный температурный режим пайки. Недостаточно просто поднять температуру в месте пайки до нужного значения. Это нужно делать постепенно и при этом точно выдерживать правильный технологический профиль для конкретного припоя, чипа и печатной платы;
  • недостаточное/слишком большое количество и/или плохое качество флюса. Здесь важно обеспечить равномерное и достаточное смачивание припоя и мест пайки, а также отсутствие появления пузырей при пайке, которые нарушают электрический контакт;

Разница между хорошим (слева) и плохим (справа) флюсом для BGA-пайки:

  • плохая подготовка мест пайки, нарушения или повреждение контактных площадок на печатной плате;
  • плохое качество или порча печатной платы вследствие действий «прогревастов»;
  • некачественные/отсутствующие шарики припоя, неверно подобранный диаметр, некорректное нанесение на чип при реболлинге/перед припаиванием на плату;

Неприпаянный BGA-шарик и спаянные вместе шарики, образующие электрический мостик в неподобающем месте:

  • припаивание BGA-микросхем с перекосом, вследствие чего некоторые контактные площадки оказываются слишком малы и быстро теряют электрический контакт.

Потеря электрического контакта, вызванная постепенным отслоением BGA-шарика:

Ускорить нарушение контакта может не только некорректная пайка, но и неблагоприятное физическое воздействие, например, падение или установка массивной системы охлаждения с перекосом.

Появление трещин в BGA-шарике из-за неравномерного физического воздействия на место пайки:

Сравнение качества пайки качественным (слева) и некачественным (справа) флюсом:

Как проявляются проблемы, связанные с отвалом BGA-чипов?

Проблемы, связанные с отвалом BGA-микросхемы, проявляются различным образом, в зависимости от того, какие имеются нарушения в цепи прохождения сигнала внутри чипа либо между микросхемой и другими электронными компонентами.

Это могут быть артефакты, ошибка 43 в Windows, невозможность установить драйвера, уход системы в BSOD (зависание) и т.д.

Как провести диагностику отвала BGA-микросхем?

Для диагностики отвала чипа стоит провести тщательное изучение дефектной платы под микроскопом. При этом точно определить, произошел ли отвал подложки/контактов у BGA-микросхемы визуальным осмотром очень тяжело, так как большая часть микросхемы находится вне поля зрения.

Тем не менее, визуальный осмотр поможет обнаружить наличие сколов, выщерблений на BGA-микросхеме, сколотый компаунд по его краям, что дает основания для предположения об отвале чипа.

Отслоение BGA-чипа под микроскопом:

В специализированных лабораториях проверку контактов BGA-чипов делают на специальном оборудовании.

Проверка контактов под BGA-чипом специальным зондом:

В продвинутых лабораториях можно изучить состояние контактов с помощью рентгеновского оборудования. На рентгеновских снимках хорошо видны недостатки, связанные с замыканиями шаров между собой, пропущенные шары и другие недостатки:

Как устранить отвал чипа?

Неисправности, связанные с отвалом чипа, касаются BGA-микросхем (видеопроцессор и чипы памяти) со множеством шариковых контактов. Их проявление можно замаскировать и отсрочить на некоторое время уход карты в мир иной, прогрев видеокарту. Этим способом ненадолго восстанавливается проводимость в месте поврежденных контактов.

Если в результате прогрева проблемного BGA-чипа устройство восстанавливает работоспособность, то в 90-95% случаев произошло расслоение внутри него, которое привело к потере контакта. Работоспособность устройства восстанавливается благодаря термическому расширению контактных шариков внутри чипа, что на некоторое время восстанавливает электрическое соединение в области поврежденных контактов.

Недобросовестные продавцы пользуются таким способом для оживления убитого чипа и продажи такой видеокарты за цену, явно превышающую ее реальную стоимость.

Более качественное позитивное воздействие на контакты может произвести реболлинг, но, если произошло отклеивание подложки внутри корпуса микросхемы (что случается чаще всего), то неисправность проявится снова.

Недостатки пайки контактных шаров BGA-микросхем, которые можно исправить с помощью реболлинга:

В большинстве случаев видеокарта с отвалом чипа требует его замены на новый. Если это касается видеопроцессора, то ремонт обычно не рентабелен, так как новый чип стоит очень дорого и дешевле купить новую видеокарту. Если ставить на место «убитого» чипа микросхему с донора, то нет гарантии того, что у него есть еще достаточный ресурс до следующего, очень скорого отвала.

Кроме того, квалификация ремонтника, а также имеющееся в его распоряжении оборудование, должны позволять выполнить качественную пайку BGA-компонентов, соблюдая все технологические нормы и температурный профиль:

В случае слишком быстрого нагрева до высокой температуры у BGA-микросхем происходит термический шок, шарики припоя и остатки флюса слишком интенсивно испаряются, производя микровзрывы, что разрушает контактные площадки и материал печатной платы. Даже если микросхема выживет при такой пайке, то контакты, созданные таким образом, не смогут прослужить долгое время.

http://bga.blog.tartanga.eus/files/2015/06/Imagen15.png

Если проблема касается BGA-микросхем памяти, то ситуация выглядит не столь печально, так как стоимость чипов VRAM относительно невелика (даже в условиях разгула барыг из-за массового спроса на банки высокой плотности после увеличения размера DAG более 4 Gb в сети Ethereum).

Как уменьшить вероятность отвала чипа при эксплуатации?

Периодическое воздействие температурных колебаний и связанное с этим неравномерное расширение-сжатие мест пайки неизбежно приведет к выходу из строя любой BGA-компонент.

Информация о величине температурного расширения различных припоев (под электрическим напряжением и без него):

Отсрочить появление проблем можно, используя качественно изготовленные устройства с BGA-пайкой, а также уменьшение температурных колебаний в помещении с работающей аппаратурой.

График, иллюстрирующий зависимость длины микротрещин, возникающих в месте BGA-пайки, от количества циклов с температурными перепадами от -40 до +125 градусов:

Как видно из графика, после 4000 циклов нагрев-охлаждение, длина микротрещин достигает 0.2-0.4 мм, что сопоставимо с размером BGA-шаров, что неизбежно вызывает отвал чипа.

В реальных условиях разница между максимальной и минимальной температурой не так велика, но, учитывая проблемы с качеством пайки, загрязнениями охлаждающей системы и другие неблагоприятные факторы, в реальной жизни проблемы появляются уже после нескольких лет (иногда месяцев) интенсивной эксплуатации.

Появление микротрещин в районе BGA-пайки различными припоями после трех тысяч циклов интенсивного нагрева-охлаждения:

Заключение

Отвал BGA-микросхем является очень неприятным сюрпризом для владельца дорогостоящих радиоэлектронных устройств. При долгой эксплуатации в неблагоприятном режиме (перегреве) появляются не только микротрещины в местах пайки, но начинает проявляться и деградация полупроводниковых элементов.

Рост микротрещины в районе BGA-пайки в процессе эксплуатации устройства из-за температурных колебаний:

В любом случае со временем произойдет ухудшение контакта BGA-чипов, его можно только отсрочить, обеспечив надлежащие условия эксплуатации, при которых исключается перегрев оборудования, а также резкие температурные скачки.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

English English Русский Русский