Только что после продажи акций за 6,6 миллиарда долларов, которая сделала его самой дорогой частной компанией в мире, видеоприложение OpenAI в стиле TikTok, работающее на новой модели искусственного интеллекта Sora 2, становится вирусным.
Несмотря на закрытый релиз, для которого требуется инвайт-код, инструмент для создания видео уже взлетел на третье место в рейтинге Яблоко App Store и вызвал волну дипфейков, в том числе вирусный клип, в котором генеральный директор Сэм Альтман ворует графические процессоры в магазине.
Внутри OpenAI это событие вновь вызвало давние дебаты внутри OpenAI о том, как сбалансировать безопасность с творческой свободой.
Человек, знакомый с внутренней стратегией в компании, сказал, что руководство считает строгие ограничения необходимым, но также беспокоится о том, что может подавить творчество или быть воспринятым как слишком много цензуры.
Эта напряженность остается нерешенной.
Культура OpenAI уже давно отдает предпочтение скорости, часто предлагая новые инструменты раньше конкурентов и позволяя общественности адаптироваться в режиме реального времени.
Один из бывших сотрудников, попросивший не называть его имени, чтобы обсуждать внутренние вопросы, рассказал CNBC, что во время их пребывания в должности руководство OpenAI имело тенденцию отдавать приоритет быстрым запускам. Эта стратегия в полной мере проявилась после того, как в конце прошлого года китайская компания DeepSeek выпустила мощную модель, которая была дешевле и быстрее в производстве, чем что-либо из Кремниевой долины.
OpenAI отреагировала в течение нескольких недель, дебютировав с двумя новыми моделями, что было воспринято как оборонительный шаг для сохранения своего лидерства.
Но у OpenAI есть ключевое преимущество: его растущая институциональная мощь.
Когда-то это была разрозненная исследовательская лаборатория в районе Мишн в Сан-Франциско, но с тех пор компания стала более структурированной, что позволило ей быстрее формировать кросс-функциональные команды и ускорять циклы разработки и развертывания таких продуктов, как Sora.
OpenAI заявила, что Sora включает в себя несколько уровней безопасности, предназначенных для предотвращения создания небезопасного контента, используя оперативную фильтрацию и модерацию вывода по видеокадрам и расшифровкам аудио. Он запрещает откровенный контент, пропаганду терроризма и материалы, пропагандирующие членовредительство. Приложение также использует водяные знаки и запрещает выдачу себя за другое лицо.
Но некоторые пользователи уже нашли способы обойти эту защиту.
Sora 2, модель искусственного интеллекта, лежащая в основе приложения OpenAI, является резким улучшением по сравнению с первой версией. Новая система генерирует более длинные и последовательные клипы, которые выглядят поразительно реалистично.
В нескольких вирусных видеороликах фигурирует Альтман после того, как он дал разрешение на использование его образа на платформе, в то время как другие изображают популярных мультяшных персонажей, таких как Пикачу и Губка Боб Квадратные Штаны, в тревожных ролях.
Контент вызвал критику о том, что OpenAI снова движется быстрее, чем его собственные ограждения. Использование материалов, защищенных авторским правом, если правообладатели не откажутся от этого, соответствует текущей политике компании, хотя этот подход оспаривается в суде.
Альтман отмахнулся от опасений, заявив в сообщении на X, что Sora — это не только прозрачность, но и создание коммерческого импульса для финансирования более широких амбиций OpenAI в области общего искусственного интеллекта.
Запуск происходит на фоне усиливающейся конкуренции. Мета На прошлой неделе Vibes запустил новую короткую видеоленту с искусственным интеллектом в своем приложении Meta AI. Гугл имеет Veo 3, в то время как ByteDance и Алибаба также дебютировали конкурирующие системы.
OpenAI, тем временем, только что взяла на себя обязательство потратить 850 миллиардов долларов, углубив свое продвижение в инфраструктуру и модели следующего поколения.
Эксперты говорят, что продвижение видео — это не просто привлечение большего количества пользователей в экосистему с помощью еще одного прилипчивого потребительского приложения.
Профессор Хао Ли, ведущий эксперт в области синтеза видео, сказал CNBC, что большинство систем искусственного интеллекта сегодня по-прежнему обучаются на лингвистических данных, таких как книги и интернет-текст. Но чтобы двигаться к общему интеллекту, по его словам, модели должны учиться на визуальной и звуковой информации, подобно тому, как ребенок познает мир через зрение.
«Мы используем искусственный интеллект для создания контента, чтобы затем обучить другую модель работать лучше», — сказал он.
Ли добавил, что его лаборатория уже использует видео, созданное искусственным интеллектом, для повышения производительности модели, возвращая синтетические данные обратно в систему.
Это часть более широкой тенденции среди исследователей, которые рассматривают генерацию видео как способ симулировать реальность и помочь моделям рассуждать как люди.
Бывший исполнительный директор OpenAI Зак Касс, чья готовящаяся к выходу книга «Следующий ренессанс: ИИ и расширение человеческого потенциала»Он размышляет о социальных последствиях искусственного интеллекта, вторит этой точке зрения.
Что касается более широкого вопроса о том, как создатели моделей должны подходить к развертыванию, Касс утверждает, что компромиссы, связанные с ранним выпуском мощных технологий, того стоят.
«Есть две альтернативы строительству на открытом воздухе: не строить вообще или строить в частном порядке. И эти альтернативы, на мой взгляд, хуже», — сказал он CNBC. «Если у нас есть революционная технология, я думаю, что люди должны знать о ней и использовать ее, чтобы мы все могли ее обновить».
ЧАСЫ: OpenAI укрепляет статус самой дорогой частной компании в мире
ЛУЧШИЙ