На фото — клип с сайта Виду, созданный искусственным интеллектом. Инструмент может создавать видео из текстовых или графических подсказок.
Эвелин Ченг | CNBC
ПЕКИН — Пекинская компания Shengshu Technology в среду заявила, что ее инструмент для преобразования текста в видео на основе искусственного интеллекта Vidu теперь сможет генерировать видео путем объединения изображений.
Vidu уже позволяет пользователям по всему миру создавать 8-секундные видеоролики на основе письменных подсказок. Хотя компания OpenAI — создатель ChatGPT — в феврале объявила, что ее модель искусственного интеллекта Sora может генерировать одноминутные видеоролики из текста, она еще не опубликовала эту информацию публично.
По словам Шэншу, новая функция искусственного интеллекта Vidu может объединить три изображения — например, рубашку, человека и мопед — в видео, на котором человек в рубашке ведет мопед по сцене.
Другие платформы утверждают, что могут превращать текст или изображения в видео с помощью ИИ, но качество вывода варьируется. Прорыв, о котором заявляет Шэншу, — это возможность сделать три уникальных изображения и объединить их с визуальной согласованностью в видео, созданное искусственным интеллектом.
«Очень рано мы определили [visual consistency] как проблему, и хотел хорошо ее решить», — сказал Фань Бао, технический директор Shengshu, на китайском языке, переведенном CNBC.
Vidu был запущен в апреле, и его способность превращать две фотографии профиля в реалистичные видеоролики обнимающихся людей стала вирусной в TikTok.
Генератор видео с искусственным интеллектом уже зарабатывает деньги на рекламодателях, аниматорах и других предприятиях, сообщил на китайском языке соучредитель и генеральный директор Shengshu Цзяю Тан, согласно переводу CNBC. Он сказал, что ежемесячные ставки использования на одного клиента могут варьироваться от 100 000 до 1 миллиона юаней (от 13 871 до 138 711 долларов США).
По словам Тана, для решения проблем с авторскими правами компания может подписать соглашение с художником, которое позволит ИИ имитировать стиль рисования художника для рекламы. Он сказал, что не видел серьезных судебных дел, связанных с использованием изображений потребителями.
Тан добавил, что Виду не позволяет публике создавать контент с использованием изображений знаменитостей или «чувствительных» людей. Он сказал, что инструмент искусственного интеллекта также запрещает изображения обнаженной натуры и насилия. Что касается личных фотографий, Тан сказал, что Виду уничтожает данные в соответствии с общими правилами защиты данных — глобальным стандартом.
По данным PitchBook, Shengshu была основана в прошлом году при поддержке Baidu Ventures, дочерней компании Alibaba Ant Group, китайского стартапа Zhipu AI, Qiming Venture Partners и города Пекина.
Тан сказал, что ИИ Виду использует арендованные облачные серверы в Китае и за рубежом.