Технические акции упали. Гигантские компании, такие как Meta и Nvidia, столкнулись с множеством вопросов об их будущем. Технологические руководители отправились в социальные сети, чтобы провозглашать свои страхи.
И все это было из-за малоизвестного китайского стартапа искусственного интеллекта под названием DeepSeek.
DeepSeek вызвал волны по всему миру в понедельник как одно из его достижений — что он создал очень мощную модель ИИ с гораздо меньшим количеством денег, чем многие эксперты по ИИ считали возможным — подняли множество вопросов, в том числе о том, были ли американские компании даже конкурентоспособными в искусственном интеллекте больше.
DeepSeek — это «момент Sputnik AI», Марк Андрейесс, технический венчурный капиталист, опубликованный в социальных сетях в воскресенье.
Как компания, о которой мало кто слышал, могла иметь такой эффект?
Что такое DeepSeek?
DeepSeek-это стартап, основанный и принадлежащий китайской торговой фирме по фондовым фондам High-Flyer. Его цель состоит в том, чтобы создать технологии ИИ в духе чат -бота Openai или Gemini. К 2021 году Deepseek приобрел тысячи компьютерных чипов у производителя чипов США Nvidia, которые являются фундаментальной частью любых усилий по созданию мощных систем ИИ.
В Китае стартап известен тем, что захватывает молодых и талантливых исследователей ИИ из ведущих университетов, обещает высокую зарплату и возможность работать над передовыми исследовательскими проектами. И High-Flyer, так и Deepseek управляют Лян Венфенг, китайский предприниматель.
За последние несколько лет DeepSeek выпустил несколько крупных языковых моделей, которые являются той технологией, которая лежит в основе чат -ботов, таких как Chatgpt и Gemini. 10 января он выпустил свое первое бесплатное приложение Chatbot, которое было основано на новой модели под названием DeepSeek-V3.
Почему фондовый рынок отреагировал на это сейчас?
Когда DeepSeek представила свою модель Deepseek-V3 на следующий день после Рождества, она соответствовала способностям лучших чат-ботов от американских компаний, таких как Openai и Google. Одно это было бы впечатляющим.
Но команда, стоящая за новой системой, также показала больший шаг вперед. В исследовательской статье, объясняющей, как она создала технологию, Deepseek сказал, что в ней использовалась лишь часть компьютерных чипов, на которые полагались ведущие компании по искусственному искусству, чтобы обучить свои системы.
Ведущие компании в мире обычно обучают своих чат -ботов с суперкомпьютерами, которые используют до 16 000 чипов или более. Инженеры Deepseek сказали, что им нужно всего около 2000 чипсов Nvidia.
Почему это важно?
С конца 2022 года, когда Openai запустил бум ИИ, преобладающим представлением было то, что самые мощные системы ИИ не могли быть построены без инвестирования миллиардов долларов в специализированные чипы ИИ. Это будет означать, что только крупнейшие технологические компании, такие как Microsoft, Google и Meta, все из которых базируются в Соединенных Штатах, могут позволить себе создать ведущие технологии.
(The New York Times подала в суд на Openai и его партнера Microsoft, претендуя на нарушение авторских прав на новостной контент, связанный с системами искусственного интеллекта. Две технологические компании отрицают претензии по иску.)
Но инженеры Deepseek сказали, что им нужно всего около 6 миллионов долларов на необработанную вычислительную мощность для обучения своей новой системы. Это было примерно в 10 раз меньше, чем то, что Meta потратила на создание своей новейшей технологии ИИ.
Как DeepSeek сделал свою технологию с меньшим количеством чипов ИИ?
Лучшие инженеры по искусственному искусству в Соединенных Штатах говорят, что исследовательская статья Deepseek изложила умные и впечатляющие способы создания технологии ИИ с меньшим количеством чипов.
Короче говоря, инженеры стартапа продемонстрировали более эффективный способ анализа данных с использованием чипов. Ведущие системы ИИ изучают свои навыки, определяя шаблоны в огромных объемах данных, включая текст, изображения и звуки. DeepSeek описал способ распространения этого анализа данных по нескольким специализированным моделям ИИ — что исследователи называют методом «смеси экспертов», — минимизирует время, теряемое с перемещением данных с места на место.
Другие использовали аналогичные методы ранее, но перемещающаяся информация между моделями имела тенденцию к снижению эффективности. DeepSeek сделал это таким образом, что позволило ему использовать меньшую вычислительную мощность.
«Стало очень ясно, что другие компании, а не только кто -то вроде Openai, могут создавать такие системы», — сказал Тим Деттмерс, исследователь Института искусственного интеллекта Аллена в Сиэтле и профессор компьютерных наук в университете Карнеги -Меллона, который Специализируется на строительстве эффективных систем ИИ. «Deepseek использовал методы, которые может дублировать каждый».
Исследовательская статья DeepSeek подняла вопросы о том, могут ли крупные американские компании поддерживать значительное лидерство в ИИ Многие эксперты считают, что технология искусственного интеллекта станет товаром, и многие компании продают почти такой же продукт.
Технология DeepSeek так же хороша, как и системы от Openai и Google?
DeepSeek-V3 может отвечать на вопросы, решать логические проблемы и писать свои собственные компьютерные программы так же эффективно, как и все, что уже на рынке, согласно стандартным тестам.
Незадолго до того, как DeepSeek выпустил свою технологию, Openai представила новую систему под названием Openai O3, которая казалась более мощной, чем DeepSeek-V3. Но OpenAI не выпустил эту систему для более широкой публики.
OpenAI O3 был разработан для «разумного» с помощью проблем, связанных с математикой, наукой и компьютерным программированием. Многие эксперты отметили, что DeepSeek не создал модель рассуждений в этих направлениях, которая рассматривается как будущее искусственного искусства
Затем 20 января Deepseek выпустила свою собственную модель рассуждений под названием Deepseek R1, и это также впечатлило экспертов. В конечном итоге это привело нам инвесторов и других в панику в конце прошлой недели и на выходных, поскольку они осознали важность новой технологии Deepseek.
Американские технологические гиганты создают центры обработки данных со специализированными чипами ИИ. Это все еще имеет значение, учитывая то, что сделал DeepSeek?
Да, это все еще имеет значение.
Большое количество чипов ИИ все еще может помочь компаниям во многих отношениях. С большим количеством чипов они могут проводить больше экспериментов, поскольку они изучают новые способы построения ИИ, другими словами, больше чипов все еще могут дать компаниям техническое и конкурентное преимущество.
По словам экспертов, также потребуется больше чипов для работы с новой породой «рассуждений» моделей искусственного интеллекта. Они требуют большей вычислительной мощности, когда люди и предприятия используют их.
Разве Соединенные Штаты не ограничили количество чипов NVIDIA, продаваемых в Китай?
Да. Чтобы поддерживать лидерство США в глобальной гонке ИИ, администрация Байдена установила правила, ограничивающие количество мощных чипов, которые можно было продавать Китаю и другим соперникам.
Но впечатляющие результаты модели Deepseek подняли вопросы о непреднамеренных последствиях торговых ограничений американского правительства. Управление заставило исследователей в Китае проявить творческий подход с широким спектром инструментов, которые свободно доступны в Интернете.
Некоторые эксперты продолжают спорить в пользу ограничений на торговлю США, заявив, что их только недавно были введены и что они будут больше влиять на способности Китая создавать ИИ с прохождением лет.
Значит ли технология Deepseek, что Китай сейчас опережает Соединенные Штаты в ИИ?
Нет. Мир еще не видел модели O3 Openai, и ее производительность на стандартных тестах была более впечатляющей, чем все остальное на рынке. Но эксперты обеспокоены тем, что Китай прыгает вперед в системах ИИ с открытым исходным кодом.
Что именно такое ИИ с открытым исходным кодом?
Как и многие другие компании, DeepSeek «открыта» подойдет »своей последней системой искусственного интеллекта, что означает, что он поделился базовым компьютерным кодом с другими предприятиями и исследователями. Это позволяет другим создавать и распространять свои собственные продукты, используя те же технологии.
Это одна из причин, по которой DeepSeek и другие в Китае смогли создать конкурентные системы ИИ так быстро и недорого.
В мире искусственного интеллекта с открытым исходным кодом впервые собрался Steam в 2023 году, когда Meta свободно разделилась системой ИИ под названием Llama. В то время многие предполагали, что экосистема с открытым исходным кодом будет процветать только в том случае, если такие компании, как Meta-гигантские фирмы с огромными центрами обработки данных, заполненными специализированными чипами-продолжали открывать свои технологии.
Но DeepSeek и другие показали, что эта экосистема может процветать так, чтобы выходить за рамки американских технологических гигантов.
Почему это важно?
Многие эксперты утверждают, что крупные американские компании не должны открывать свои технологии, потому что их можно использовать для распространения дезинформации или нанесения другого серьезного вреда. Некоторые американские законодатели изучили возможность предотвращения или дросселирования практики.
Но другие эксперты утверждают, что если регулирующие органы подавляют прогресс технологий с открытым исходным кодом в Соединенных Штатах, Китай получит значительное преимущество. Эти эксперты утверждают, что если лучшие технологии с открытым исходным кодом поступят из Китая, американские исследователи и компании построят свои системы на этих технологиях.
В долгосрочной перспективе это может поставить Китай в центр исследований и разработок ИИ, что может еще больше ускорить его усилия по созданию широкого спектра технологий ИИ, включая автономное оружие и другие военные системы.