Нейросеть от Google научилась генерировать диалоги в видео

Share

Компания Google представила новую модель искусственного интеллекта Veo 3. Новинку показали на прошедшей накануне конференции разработчиков Google I/O 2025. 

Как рассказали разработчики, новая нейросеть способна генерировать видео со звуком. Речь идет о звуковых эффектах, фоновом шуме и даже диалогах сгенерированных персонажей. При этом, как утверждают в Google, Veo 3 превосходит свою предыдущую модель Veo 2 в качестве генерируемой картинки.

Самая успешная компания XXI века
Ее создал мигрант из ЮАР, который никогда не занимался бизнесом. Он смог потеснить Red Bull

Представляя новинку генеральный директор Google DeepMind, подразделения Google по исследованиям и разработкам в области искусственного интеллекта Демис Хассабис заявил: «Мы выходим из безмолвной эпохи создания видео».

«[Вы можете дать Veo 3] подсказку, описывающую персонажей и окружающую среду, и предложить диалог с описанием того, как вы хотите, чтобы он звучал», — заверил он. Пользователи также уже успели опробовать новинку. Так, в сети распространились ролики с нарезкой кадров с самых разных жанрах от нуарного кино до анимации, в которых все персонажи произносят одну и ту же фразу — «Мы можем говорить».

Как сообщается, Veo 3 будет доступна пользователям приложения чат-бота от Google Gemini, которые оформили подписку по тарифному плану AI Ultra стоимостью 249,99 долларов в месяц.

Кирилл, Ева тебе не простит
Камера видеонаблюдения зафиксировала, как мужчина зарезал жену, умолявшую его остановиться. Он может избежать тюрьмы

В начале мая Би-би-си сообщило о том, что в США на суде по делу об убийстве с речью выступила ИИ-версия убитого. Его родственники создали образ погибшего с помощью нейросети, предоставив ей прижизненные фото и видео мужчины. Затем сестра погибшего написала текст речи и записала соответствующее видео, на котором сгенерированный ИИ образ произносит ее.