Google выпустила обновление для своего чат-бота Gemini, которое добавляет поддержку Veo 2, модели ИИ для преобразования текста в видео. Это ответ на платформу генерации видео Sora от OpenAI.
Модель умеет генерировать восьмисекундные видео разрешением 720p и лучше по сравнению с конкурентами «понимает физику реального мира и нюансы человеческих движений и мимики». Моментами от живых съемок реально сложно отличить, передает Android Authority.
Пользователи могут выбирать Veo 2 в выпадающем меню моделей как на веб-платформе, так и в мобильном приложении. Сейчас доступ дали только через подписку Google One AI Premium, которая стоит $20 в месяц.
Альтернативный способ получить доступ к Veo 2 – использовать инструмент Whisk Animate, который позволяет превращать изображения в короткие 8-секундные анимации. Как и Veo 2, эта функция доступна только для подписчиков Gemini Advanced через Google Labs.
Ранее в этом месяце вышла новая версия Midjourney для генерации изображений. По заявлениям разработчиков, это их «самая умная, самая красивая и самая связная модель».
Добавим, OpenAI создаст соцсеть, чтобы конкурировать с Илоном Маском и Meta.