Статьи

DeepSeek — интеллект не измеряется деньгами

2025-й год с самого начала демонстрирует множество сюрпризов, связанных с технологическим ростом (и не только).

В январе этого года стала широко известной информация о производительности DeepSeek-V3, новой модели open-source общего искусственного интеллекта (AGI).

Что говорит о себе сам DeepSeek-V3:

DeepSeek-V3 — это аналог Chat-GPT, искусственный интеллект, предназначенаный для обработки естественного языка (NLP). Он может использоваться для генерации текста, получения ответов на различные вопросы, анализа данных, переводов с иностранных языков, написания компьютерного кода и многого другого.

DeepSeek создан и развивается китайской компанией Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd (основана в 2023 году как дочерняя компания High-Flyer) во главе с Лян Вэньфэном (Liang Wenfeng).

Лян Вэньфэн, генеральный директор DeepSeek:

DeepSeek-V3 — это не упрощенная, а полноценная языковая модель искусственного интеллекта, оперирующая 671 млрд. параметров.

DeepSeek не только умен, но скромен. При ответе на вопрос о самом умном AI он говорит только о GPT-4, Google DeepMind, Claude, PaLM 2, IBM Watson, Tesla Autopilot и Full Self-Driving, не упоминая себя:

Исходный код DeepSeek доступен на github.com, репозиторий deepseek-ai:

В отличие от примерно равных по мощности OpenAI o1, GPT-4o и Claude 3.5, модели DeepSeek-V3 удалось достичь аналогичных и даже более впечатляющих результатов при гораздо меньших затратах. На ее разработку было потрачено около 5.5 млн. долларов, в то время как GPT-4 для получения аналогичной производительнсти «скушал» около 100 млн. USD.

Сравнение производительности DeepSeek-V3 с другими репрезентативными моделями искусственного интеллекта, включая DeepSeek-R1):

Эксперты считают, что появление DeepSeek-V3 изменит существующую ситуацию в сфере искусственного интеллекта, в которой доминируют потребляющие большое количество энергии дорогостоящие серверы. Появление альтернативы может привлечь в AI больше стартапов и технологических компаний, что еще больше подтолкнет развитие этой сферы.

Немаловажно отметить, что DeepSeek-V3 прекрасно работает как на мощных видеокартах Nvidia, так и на видеоускорителях AMD. Для работы с DeepSeek не требуется иметь новейшее супермощное оборудование, эксклюзивно выпускаемое производителями-монополистами. В связи с этим, очень быстро после появления новостей о прорыве в AI-производительности, связанным с DeepSeek V3, обрушилась цена акций/рыночная капитализация Nvidia:

Прогнозируемое падение спроса на новейшие видеокарты Nvidia вынудит снизить цены на их продукцию, что не может не радовать обычных людей, для которых покупка Nvidia Ge Force RTX 5090 является непосильной задачей…

Заключение

Создание DeepSeek стало возможным благодаря оптимизации использования доступных ресурсов и использованию преимуществ открытого исходного кода, развитию которого помогают множество энтузиастов со всего земного шара.

Без сомнений, такой прорыв был бы невозможен без технологической культуры Китая, в которой упор делается на инновации. В то время как в некоторых странах жгут книги, переписывают историю, уничтожают памятники и запрещают говорить на родном языке, Китай развивается…

Ограничение доступа к любой информации и технологиям, установление различных ограничений и барьеров в современном мире являются анахронизмом. Путь, который выбрал Китай и придерживаются такие гиганты мысли/инноваций, как Илон Маск, является выходом из того «радужного» положения, в котором оказалась цивилизация в начале 2020-х годов.

Время покажет, сможет ли DeepSeek и дальше быстро развиваться, кардинально меняя существующие правила игры. Уже сейчас очевидно его влияние на множество секторов, включая технологии, финансы и криптовалютную сферу. Акции Nvidia и других компаний не дадут соврать… Без сомнений, появление достойного конкурента и здоровая конкуренция в целом окажут положительное влияние на развитие технологии AI.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *