Китайская ИИ-модель DeepSeek уже потрясла рынок ИТ, заставив инвесторов в панике распродавать акции. Инсайдеры сообщают, что она работает на чипах HUAWEI, хотя компания уже не первый год под санкциями.
При этом в сфере искусственного интеллекта происходит очередной виток конкуренции. Китайская компания DeepSeek представила свою ИИ-модель R1, которая, по заявлениям, значительно превосходит американских конкурентов в вопросе стоимостной эффективности. Чат-бот DeepSeek взлетел на вершину App Store уже в 51 стране, и теперь выяснилось, что он использует чипы HUAWEI для работы.
Модель R1 от DeepSeek была обучена на чипах NVIDIA H100, но для работы используется чип Ascend 910C от HUAWEI. Об этом сообщил инсайдер @Dorialexander. Такой подход позволяет снизить затраты, так как чипы Ascend хуже подходят для обучения, но требуют меньше энергии непосредственно для эксплуатации готовой модели.
Ограниченность чипа 910C HUAWEI планирует исправить с новым чипом 920C, который должен соперничать с ведущим вариантом NVIDIA — Blackwell B200.
Говорят, что DeepSeek использовал более 50 000 чипов NVIDIA H100 для обучения, что ставит под сомнение заявления о сверхнизкой стоимости обучения. Расходы в 5 миллионов долларов, о которых упоминалось ранее, относятся только к эксплуатации модели, а не к её обучению. Но в любом случае DeepSeek уже вызвал переполох на рынке, уменьшив стоимость акций на 2 триллиона долларов в США, что вызвало панику среди инвесторов. Однако точные вычислительные ресурсы, использованные для R1, остаются неясными, что порождает множество спекуляций в СМИ.
На фоне всего этого интерес к чипам HUAWEI в Китае растёт: компании ByteDance и Tencent уже проявили интерес к массовому производству чипов Ascend 910C, которое планируется начать в первом квартале 2025 года.
По мотивам: GSMarena.