Трудно переоценить, насколько эффективный был DeepSeek. Через пару дней он утроил всю индустрию ИИ, разрушив ауру непобедимости, которую OpenAI (и американские технологические компании в целом) построили вокруг себя. Новое ИИ DeepSeek — это самое загруженное бесплатное приложение номер один в Apple Store, и нетрудно понять, почему: оно конкурирует или превышает платные варианты OpenAI. Но это даже не самая лучшая часть: Deepseek утверждает, что на строительство потребовалось всего два месяца и стоило менее 6 миллионов долларов. Модель DeepSeek R1 стоит 1/20 денег, чтобы запустить флагманскую модель O1 Chatgpt. Это также открытый исходный код.

Они доказали, что Сэм Альтман очень неправ

В 2023 году Альтмана спросили, может ли умная команда с бюджетом около 10 миллионов долларов попытаться создать продукт, конкурирующий с Openai. Ответ Альтмана был (как это часто бывает) дерзкий:

«Послушайте, как это работает, мы собираемся сказать вам, что совершенно безнадежно конкурировать с нами на моделях обучения фонда, которые вы не должны попробовать, и это ваша работа, например, попробуйте». Ну, они пытались, и Альтман сейчас не очень дерзкий.

Он высоко оценил Deepseek R1, и пообещал Openai, создаст лучшие модели, но рынок и экспертные эксперты кажутся менее уверенными.

Это не просто Openai, все волнуются

Это не первая эффективная модель искусственного интеллекта с открытым исходным кодом (исходный код свободно доступен для всех, кто может просмотреть, изменять и распространять по разрешающей лицензии). Материнская компания Facebook, Meta, также выбрала аналогичную стратегию со своими моделями LLAMA. Но релизы Llama были относительно медленными и не такими дешевыми и эффективными, как DeepSeek. По сообщениям, Meta — это выяснить «военные комнаты» инженеров, чтобы выяснить, как DeepSeek делает это.

Чтобы сделать вещи еще более поразительными, DeepSeek управлял этим выступлением, используя менее распространенные чипы Nvidia H800. Чипы ИИ стоят сотни или даже тысячи раз быстрее и эффективнее, чем процессоры для обучения ИИ, и Нвидия, безусловно, является лидером в этой области. Эти чипы считались настолько важными, что президент Байден издал Закон о фишках, который предотвратил экспорт в Китае современные чипсы в Китае. Ну, DeepSeek сделал это без этих чипсов.

Стокольный индекс Nasdaq погрузился в новости, как и возлюбленная фондового рынка Nvidia. Nvidia, которая выросла почти на 2000% за последние 5 лет, снизилась на 16% за один день. В целом, Deepseek проложил 1 триллион долларов на глобальных рынках, в основном так, как его можно использовать, загружать и усовершенствовать любым бесплатно.

DeepSeek Performance конкурирует или превышает лучшие современные модели ИИ, несмотря на то, что вкладывают часть их финансирования и таланта. Кредит: Hackaday.

Вайбхав Шривастав, инженер Hugging Face (платформа для строительства, обмена и развертывания моделей машинного обучения, с духом с открытым исходным кодом), сказал, что это должен быть «унизительный» момент для американских гигантов ИИ. Он добавил, что если бы Openai поделился своими ресурсами с другими игроками в Америке, технологии продвинулись бы дальше. Он добавил, что реальный вопрос заключается в том, почему подход Meta от открытого исходного кода не давал столько преимуществ. «Что, черт возьми, делает мета? Это было их проиграть », — сказал исследователь.

На прошлой неделе Meta заявила, что только в этом году она потратит более 60 миллиардов долларов на развитие ИИ, в то время как Альтман сказал, что отрасли потребуются триллионы долларов в инвестициях, чтобы поддержать центры обработки данных, которые управляют сложными моделями.

Что это на самом деле означает для отрасли

DeepSeek (логотип которого — голубой кит) атакует, казалось бы, непроницаемую крепость Big Tech AI. Иллюстрация Midjourney.

Маловероятно, что все переедут на китайский продукт на ночь. Рыночные распродажи часто чрезмерно реагируют, и время покажет, является ли DeepSeek настоящим конкурентом для лидерства ИИ. Как отмечает Шривастав, это часто не способность модели, а насколько хорошо она интегрирована в другие приложения.

Кроме того, мир ИИ является очень активной областью исследований с постоянными сдвигами и изменениями. Тем не менее, учитывая, что проект считался «побочным проектом», и что он настолько дешево, результаты действительно разрушительны.

Индустрия искусственного интеллекта стала самодовольной. Президент Трамп обнял большие технологии, и большие технологии вернули его, так что все казалось плавным, но конкурентоспособных отраслей редко бывает гладкой. Это приведет к пробуждению для индустрии и покажет, что инновационная гонка ИИ далеко не выиграна.

Общий подход (и то, что поддерживало митинг Nvidia, была идея, что вам нужно чистое вычислительное превосходство для создания лучших моделей. Это был барьер для других участников. Если вам нужно много обработки мощности для создания моделей, вам нужно много денег для этого. Это то, что побудило Альтман «безнадежные» комментарии. Результаты Deepseek показывают, что это не так, и дверь может быть открыта и для других конкурентов. Тот факт, что модель является открытым исходным кодом, вероятно, означает, что мы скоро увидим много дополнительных пособий.

Если подход DeepSeek подтвержден, крупные технологические компании, такие как Amazon, Alphabet, Meta и Microsoft, возможно, потребуются повернуть из текущих планов. Они уже были инвестированы в центры обработки данных искусственного интеллекта (которые включают в себя много чипов и много энергии). Если это не обязательно, это было бы хорошей новостью для планеты, так как жаждущие мощности центры обработки данных уже оказали влияние на глобальное использование энергии. Это также может освободить некоторые ресурсы от Big Tech и позволить им сосредоточиться на других типах инноваций, кроме подхода «грубой силы». Но это также говорит о том, что крепость вокруг усилий AI Big Tech может быть не такой непроницаемой, как мы думали. Проще говоря, мы, вероятно, скоро увидим гораздо более конкурентоспособные модели — потому что DeepSeek (в отличие от продуктов Openai) можно загрузить и работать на персональных компьютерах, даже без подключения к Интернету.

Что вы должны знать о DeepSeek

Компания была основана в 2023 году Ляном Венфенгом — не нарицательное в мире ИИ до сих пор. Венфенг — электронный инженер, который окончил свои магистерские исследования в 2010 году. С тех пор он работал в количественной торговле и пытался интегрировать математику и ИИ в торговле. К 2019 году он управлял активами около 13 миллиардов долларов. Он неоднократно говорил о том, как китайские компании слишком привыкли следовать, и вместо этого должен попытаться вывести рынки.

DeepSeek был основан, когда Лян приобрел 10 000 графических процессоров NVIDIA A100, прежде чем правительство США наложило ограничения AI Chips на Китай. В Китае он быстро стал известен своей дешевой альтернативой ИИ, что привело к ценовой войне с другими конкурирующими китайскими компаниями ИИ, такими как Bytedance. Несмотря на то, что Deepseek взимал более низкие цены, чем его конкуренты, это было прибыльным, в то время как его конкуренты теряли деньги — признак того, что их модели уже были очень эффективными.

Тем не менее, Лян заявил, что DeepSeek сосредоточен исключительно на исследованиях и не имеет подробных планов по коммерциализации, что позволило ему избежать строгих положений, наложенных правительством Китая. Это также означает, что он должен соблюдать цензуру, наложенную Китаем. Например, он откажется говорить о резни в Тяньанмене или других темах, которые Китай считает «чувствительными», такими как преследование Китая уйгуров или права человека в Китае.

R1 Deepseek назвал Тайвань «неотъемлемой частью территории Китая», и заявил: «Мы твердо противостоят любой форме сепаратистской деятельности« Независимости »Тайваня и привержены достижению полной воссоединения родины мирами».

Просто говоря, DeepSeek-это чат-бот с AI, как Chatgpt. В описании приложения смутно говорится, что он предназначен «для того, чтобы ответить на ваши вопросы и эффективно улучшить вашу жизнь». Он работает на том же общем подходе, что и модель O1 открытого AI, используя многоэтапные «рассуждения», в настоящее время считается наиболее мощным подходом.

Коммунистическая партия Китая еще не прокомментировала достижения, но китайские государственные СМИ были ликованы, отметив, что Силиконовая долина «теряет сон» из -за DeepSeek.

«В Китае достижения Deepseek отмечаются как свидетельство растущего технологического мастерства и самоотправиции в стране»,-говорит BBC Марина Чжан, доцент Технологического университета Сиднея.

«Успех компании рассматривается как проверка инноваций Китая 2.0, новой эры доморощенного технологического лидерства, обусловленного молодым поколением предпринимателей».

Потребители, желающие использовать этот продукт, должны знать о потенциальных проблемах конфиденциальности. В то время как цензура подтверждается DeepSeek, есть также опасения, что система ИИ может быть использована для иностранного влияния, дезинформации, наблюдения и развития киберппонов для китайской секретной службы. Как и Тикток, эксперты предупреждают, что приложение «явно» передает личные данные в Китай.