Gemini Omni Flash уже доступен: что умеет новый AI от Google

Gemini Omni Flash уже доступен

20 мая на конференции Google состоялась долгожданная презентация Google I/O 2026, и главным событием для всех, кто следит за развитием генеративного видео и AI-контента, стала новая модель Gemini Omni. Компания делает серьёзную ставку на мультимодальный искусственный интеллект, который умеет одновременно работать с видео, изображением, голосом, персонажами и окружающей средой в реальном времени.

Пока первые выводы строятся на официальной презентации, демонстрациях со сцены и многочисленных утечках последних недель. Реальные возможности, ограничения и качество генерации станут понятны только после массового тестирования пользователями. Но уже сейчас ясно: Google хочет кардинально изменить рынок AI-видеогенерации и конкурировать с такими проектами, как Sora.

Что такое Gemini Omni и как работает новая AI-модель Google

Главная идея Gemini Omni — максимально упростить создание видео с помощью искусственного интеллекта.

Пользователь загружает любое фото или видео из галереи, после чего может текстом или голосом объяснить, что именно нужно изменить или создать. Модель самостоятельно генерирует новый результат без необходимости использовать сложные редакторы, монтажные программы или отдельные инструменты постобработки.

Одной из ключевых особенностей стала многоэтапная генерация. Каждая новая команда наслаивается поверх предыдущего результата. Это позволяет не начинать работу заново после каждой правки, а постепенно дорабатывать сцену, меняя окружение, стиль, ракурс камеры, персонажей или действия.

По словам Google, модель понимает физику сцены и последствия изменений. Это означает более реалистичное поведение объектов, света, движения и взаимодействия персонажей внутри кадра.

Сегодня пользователям стала доступна облегчённая версия Omni Flash, а полноценная версия Omni Pro ожидается позже.

Генерация видео и звука одновременно

Одним из самых обсуждаемых нововведений стала синхронная генерация видео и пространственного аудио за один проход.

Ранее в большинстве AI-видеомоделей звук создавался отдельно. В случае с Gemini Omni изображение и аудио появляются одновременно:

  • шаги синхронизируются с движением ног;
  • реплики совпадают с движением губ;
  • фоновые шумы сцены соответствуют окружению;
  • пространственный звук меняется вместе с камерой и положением объектов.

Если технология действительно работает так, как её показывали на презентации, это способно серьёзно сократить объём пост-продакшна при создании AI-контента.

Постоянные AI-персонажи и единый каст

Одной из главных проблем генеративного видео долгое время оставалась невозможность сохранять одинаковый внешний вид персонажей между сценами.

В Gemini Omni Google обещает решить эту проблему через систему постоянного каста персонажей.

Пользователь может:

  • создать героя по текстовому описанию;
  • использовать референсное изображение;
  • закрепить уникальный голос;
  • вызывать персонажа в любой сцене через команду @имя.

Модель должна сохранять одинаковую внешность, стиль речи и голос персонажа между разными роликами и сценами. Именно на этом раньше спотыкались практически все крупные AI-видеосистемы.

AI-аватары для блогеров и контент-мейкеров

Для платных подписчиков Google открыла экспериментальную функцию Avatar.

Теперь пользователь может загрузить своё лицо и голос, создать собственного цифрового персонажа и использовать его в любых проектах.

По сути, это полноценный AI-аватар, который становится частью общей системы каста и вызывается в кадр через @имя.

Для YouTube-блогеров, TikTok-креаторов и авторов коротких видео это может стать одним из самых востребованных инструментов. Больше не нужно записывать себя на камеру под каждый ролик — достаточно подготовить сценарий и сгенерировать нужную сцену.

Видео в видео и изменение стиля роликов

Новая модель поддерживает формат Video-to-Video генерации.

Пользователь может загрузить собственный видеоролик и текстом изменить:

  • стиль изображения;
  • окружение;
  • действия персонажей;
  • художественную обработку;
  • визуальную эпоху;
  • тип анимации.

Например, реалистичное видео можно превратить в аниме, мультфильм или сцену эпохи Возрождения. Каждая новая правка сохраняется поверх предыдущей генерации.

Кинематографическое качество видео

На старте Google ограничила продолжительность роликов до 10 секунд.

Компания подчёркивает, что это не технический предел модели, а временное продуктовое ограничение для массового запуска. Более длинные видео обещают добавить позднее.

Главный акцент сделан на кинематографическом реализме:

  • плавное движение камеры;
  • физически корректное освещение;
  • реалистичные эмоции;
  • сложные движения персонажей;
  • детализированные сцены.

Поддержка мультимодальных референсов

В одной генерации Gemini Omni может одновременно использовать:

  • несколько изображений;
  • нескольких персонажей;
  • разные голоса;
  • текстовые описания;
  • стилистические референсы.

Это открывает возможности для полноценного AI-продакшна внутри одной системы.

AI наконец научился нормально писать текст в кадре

Отдельное внимание пользователи обратили на генерацию текста внутри видео.

Во время одной из демонстраций профессор писал математическую формулу на доске, и она оказалась не просто набором случайных символов, а корректным математическим выражением.

Это одна из старых проблем большинства AI-видеомоделей, где текст в кадре обычно превращался в нечитаемый набор букв.

Google Flow — новый центр AI-видеомонтажа

Вместе с Gemini Omni активно развивается и Google Flow.

Платформа превращается в полноценный AI-комбайн для создания контента:

  • кастомные инструменты;
  • собственные рабочие процессы;
  • шаблоны генерации;
  • библиотеки персонажей;
  • готовые пайплайны.

Пользователи смогут создавать собственные инструменты на естественном языке и делиться ими с другими авторами.

Где доступен Gemini Omni

На момент запуска Omni Flash уже доступен:

  • в приложении Gemini;
  • в Google Flow;
  • в YouTube Shorts.

Бесплатно протестировать часть функций можно через YouTube Create и Shorts, однако полный набор возможностей, включая аватары, доступен только платным подписчикам.

Ограничения и лимиты новой модели

Google отдельно предупредила о высокой вычислительной нагрузке модели.

По ранним тестам всего два сложных запроса в Omni могли использовать до 86% дневной квоты тарифа Gemini Pro.

Из-за этого компания меняет систему ограничений:

  • лимиты больше не считаются по числу запросов;
  • теперь учитывается объём потреблённых вычислений;
  • простой текст расходует мало ресурсов;
  • генерация сложного видео требует значительно больше мощности.

Лимиты обновляются каждые пять часов до достижения недельного потолка.

Новые цены на подписки Google AI

Вместе с запуском Omni Google представила новый тариф AI Ultra за 100 долларов в месяц.

Он предназначен для пользователей, которым уже недостаточно стандартного Gemini Pro за 20 долларов, но не нужен максимальный тариф за 250 долларов.

Также старшая подписка Ultra подешевела с 250 до 200 долларов при сохранении полного набора функций.

SynthID и защита AI-контента

Все ролики, созданные через Gemini Omni, автоматически получают цифровой водяной знак SynthID.

Google заявляет, что систему уже поддерживают:

  • Google Search;
  • браузер Chrome;
  • инструменты проверки AI-контента;
  • часть решений от OpenAI.

Итоги

Запуск Gemini Omni может стать одним из крупнейших событий на рынке генеративного видео за последние годы. Google делает ставку не просто на AI-генерацию роликов, а на создание полноценной мультимодальной экосистемы, где текст, изображение, видео, звук, персонажи и монтаж объединяются в одном инструменте.

Если реальные тесты подтвердят хотя бы половину заявленных возможностей, рынок AI-контента ждёт очень серьёзный сдвиг уже в ближайшие месяцы.