Генерація і редагування відео з використанням штучного інтелекту – Google презентувала Gemini Omni – технологічні новини

Генерація і редагування відео з використанням штучного інтелекту - Google презентувала Gemini Omni - технологічні новини 1 Нова модель має можливість генерувати та редагувати контент на основі тексту, зображень, аудіо та відео.

Компанія представила нову мультильну модель штучного інтелекту Gemini Omni, яка здатна створювати відео з будь-якої комбінації вхідних даних. Першою моделлю в цій новій групі стала Gemini Omni Flash, яку вже почали інтегрувати в застосунок Gemini, сервіс Google Flow та YouTube Shorts.

Як зазначили в Google, Gemini Omni може “створювати що завгодно з будь-чого”, зокрема поєднує можливості міркування Gemini з умінням генерувати та редагувати контент на основі тексту, зображень, аудіо та відео. У компанії підкреслили, що модель може змінювати окремі об’єкти, середовище, стиль або рух, не втрачаючи контексту початкового відео.

Gemini Omni також отримала покращене розуміння фізичних процесів. У компанії повідомили, що система краще справляється з моделюванням гравітації, кінетичної енергії та гідродинаміки, що дозволяє створювати більш реалістичні сцени.

Окремо Google акцентує на здатності Omni поєднувати творчість зі знаннями Gemini в науці, історії та культурі. Модель може генерувати складні пояснювальні відео, зокрема наукові візуалізації або освітні ролики, на основі коротких текстових запитів.

Система підтримує комбінування різних типів контенту в одному проєкті. Користувачі можуть завантажувати зображення, відео, текстові описи або аудіофайли, а Omni створюватиме єдиний відеокліп із синхронізованими ефектами та стилістикою.

У Google також представили функцію Avatars, яка дозволяє створювати цифрового аватара з власним голосом та зовнішністю. Компанія зазначає, що наразі триває тестування функцій зміни голосу та мови для безпечного використання технології.

Всі відео, створені через Gemini Omni, автоматично отримуватимуть цифровий водяний знак SynthID. У Google повідомили, що контент можна буде перевірити через Gemini, та пошук Google.

Gemini Omni Flash вже почали розгортати для передплатників Google Plus, Pro та Ultra по всьому світу. Також модель стане доступною безкоштовно в YouTube Shorts і застосунку YouTube Create. У найближчі тижні Google планує відкрити доступ до Omni через API для розробників і корпоративних клієнтів.

Водночас Google представила масштабне оновлення Пошуку (Search) з новими функціями штучного інтелекту та агентними можливостями. Відтепер режим AI Mode працюватиме на базі моделі Gemini 3.5 Flash, яка стане моделлю за замовчуванням для користувачів у всьому світі.

Схожі публікації
2 коментарів
  1. Ірина С. каже

    Вражає, як штучний інтелект Gemini Omni відкриває нові можливості для створення відео. Це справжній прорив у поєднанні творчості та технологій! Чекаю на практичне застосування.

    1. Катерина Мельник каже

      Дякуємо за ваш відгук! Gemini Omni дійсно розширює горизонти відеомонтажу, роблячи процес більш інтуїтивним і креативним. Сподіваємося, що скоро ви зможете випробувати всі його переваги на практиці!

Залишити відповідь