Sora 2 от OpenAI вызвала негативную реакцию ИИ

Только что после продажи акций за 6,6 миллиарда долларов, которая сделала его самой дорогой частной компанией в мире, видеоприложение OpenAI в стиле TikTok, работающее на новой модели искусственного интеллекта Sora 2, становится вирусным.

Несмотря на закрытый релиз, для которого требуется инвайт-код, инструмент для создания видео уже взлетел на третье место в рейтинге Яблоко App Store и вызвал волну дипфейков, в том числе вирусный клип, в котором генеральный директор Сэм Альтман ворует графические процессоры в магазине.

Внутри OpenAI это событие вновь вызвало давние дебаты внутри OpenAI о том, как сбалансировать безопасность с творческой свободой.

Человек, знакомый с внутренней стратегией в компании, сказал, что руководство считает строгие ограничения необходимым, но также беспокоится о том, что может подавить творчество или быть воспринятым как слишком много цензуры.

Эта напряженность остается нерешенной.

Культура OpenAI уже давно отдает предпочтение скорости, часто предлагая новые инструменты раньше конкурентов и позволяя общественности адаптироваться в режиме реального времени.

Один из бывших сотрудников, попросивший не называть его имени, чтобы обсуждать внутренние вопросы, рассказал CNBC, что во время их пребывания в должности руководство OpenAI имело тенденцию отдавать приоритет быстрым запускам. Эта стратегия в полной мере проявилась после того, как в конце прошлого года китайская компания DeepSeek выпустила мощную модель, которая была дешевле и быстрее в производстве, чем что-либо из Кремниевой долины.

OpenAI отреагировала в течение нескольких недель, дебютировав с двумя новыми моделями, что было воспринято как оборонительный шаг для сохранения своего лидерства.

Но у OpenAI есть ключевое преимущество: его растущая институциональная мощь.

Когда-то это была разрозненная исследовательская лаборатория в районе Мишн в Сан-Франциско, но с тех пор компания стала более структурированной, что позволило ей быстрее формировать кросс-функциональные команды и ускорять циклы разработки и развертывания таких продуктов, как Sora.

OpenAI заявила, что Sora включает в себя несколько уровней безопасности, предназначенных для предотвращения создания небезопасного контента, используя оперативную фильтрацию и модерацию вывода по видеокадрам и расшифровкам аудио. Он запрещает откровенный контент, пропаганду терроризма и материалы, пропагандирующие членовредительство. Приложение также использует водяные знаки и запрещает выдачу себя за другое лицо.

Но некоторые пользователи уже нашли способы обойти эту защиту.

Sora 2, модель искусственного интеллекта, лежащая в основе приложения OpenAI, является резким улучшением по сравнению с первой версией. Новая система генерирует более длинные и последовательные клипы, которые выглядят поразительно реалистично.

В нескольких вирусных видеороликах фигурирует Альтман после того, как он дал разрешение на использование его образа на платформе, в то время как другие изображают популярных мультяшных персонажей, таких как Пикачу и Губка Боб Квадратные Штаны, в тревожных ролях.

Контент вызвал критику о том, что OpenAI снова движется быстрее, чем его собственные ограждения. Использование материалов, защищенных авторским правом, если правообладатели не откажутся от этого, соответствует текущей политике компании, хотя этот подход оспаривается в суде.

Альтман отмахнулся от опасений, заявив в сообщении на X, что Sora — это не только прозрачность, но и создание коммерческого импульса для финансирования более широких амбиций OpenAI в области общего искусственного интеллекта.

Запуск происходит на фоне усиливающейся конкуренции. Мета На прошлой неделе Vibes запустил новую короткую видеоленту с искусственным интеллектом в своем приложении Meta AI. Гугл имеет Veo 3, в то время как ByteDance и Алибаба также дебютировали конкурирующие системы.

OpenAI, тем временем, только что взяла на себя обязательство потратить 850 миллиардов долларов, углубив свое продвижение в инфраструктуру и модели следующего поколения.

OpenAI достигла рубежа в 500 миллиардов долларов

Эксперты говорят, что продвижение видео — это не просто привлечение большего количества пользователей в экосистему с помощью еще одного прилипчивого потребительского приложения.

Профессор Хао Ли, ведущий эксперт в области синтеза видео, сказал CNBC, что большинство систем искусственного интеллекта сегодня по-прежнему обучаются на лингвистических данных, таких как книги и интернет-текст. Но чтобы двигаться к общему интеллекту, по его словам, модели должны учиться на визуальной и звуковой информации, подобно тому, как ребенок познает мир через зрение.

«Мы используем искусственный интеллект для создания контента, чтобы затем обучить другую модель работать лучше», — сказал он.

Ли добавил, что его лаборатория уже использует видео, созданное искусственным интеллектом, для повышения производительности модели, возвращая синтетические данные обратно в систему.

Это часть более широкой тенденции среди исследователей, которые рассматривают генерацию видео как способ симулировать реальность и помочь моделям рассуждать как люди.

Бывший исполнительный директор OpenAI Зак Касс, чья готовящаяся к выходу книга «Следующий ренессанс: ИИ и расширение человеческого потенциала»Он размышляет о социальных последствиях искусственного интеллекта, вторит этой точке зрения.

Что касается более широкого вопроса о том, как создатели моделей должны подходить к развертыванию, Касс утверждает, что компромиссы, связанные с ранним выпуском мощных технологий, того стоят.

«Есть две альтернативы строительству на открытом воздухе: не строить вообще или строить в частном порядке. И эти альтернативы, на мой взгляд, хуже», — сказал он CNBC. «Если у нас есть революционная технология, я думаю, что люди должны знать о ней и использовать ее, чтобы мы все могли ее обновить».

ЧАСЫ: OpenAI укрепляет статус самой дорогой частной компании в мире

OpenAI укрепляет статус самой дорогой частной компании в мире