Вышел Grok Imagine Video 1.5 от xAI

Вышел Grok Imagine Video 1.5 от xAI

Налейте чашку кофе и отложите дела на пару минут — это та самая новость в сфере нейросетей, ради которой точно стоит притормозить. Компания xAI выкатила масштабное обновление своей видеомодели, и результаты заслуживают пристального внимания.

Модель Grok Imagine Video 1.5 вышла 30 мая и пока находится в статусе превью. Это означает раннюю, несколько сырую версию: возможны баги, временные ограничения и изменения параметров без предупреждения. Однако даже в таком виде модель успела сделать громкое заявление на рынке генеративного ИИ.

Смена лидера: Первое место в рейтингах

Версия 1.5 в разрешении 720p заняла первое место в престижном слепом тестировании Image-to-Video Arena. Нейросеть от Илона Маска обошла таких сильных конкурентов, как ByteDance Seedance 2.0 и Google Veo.

Прирост оказался внушительным — плюс 52 балла Elo по сравнению с прошлой версией. Для всех, кто следит за технологической гонкой видеомоделей, это крайне серьезная заявка на доминирование.

Что улучшили в версии 1.5

Обновление сфокусировано на качестве генерации. Разработчики подтянули несколько критически важных аспектов:

  • Точность звукового сопровождения стала заметно выше.
  • Улучшена связность видеоряда от кадра к кадру (уменьшено количество артефактов).
  • Вырос общий уровень фотореализма.
  • Значительно повышена точность генерации лиц, что критично при работе с постоянными персонажами и крупными планами.

Технические характеристики и сценарии работы

Семейство Imagine предлагает не просто генерацию роликов с нуля, а полноценный набор рабочих сценариев под разные задачи, включая image-to-video, редактирование готового видео, reference-to-video и органичное расширение клипов.

Основные параметры генерации:

  • Ввод и вывод: Текст и изображение на входе, видеоролик на выходе.
  • Длительность: Ролики до 15 секунд.
  • Разрешение: Доступны варианты 480p и 720p.
  • Форматы: 6 соотношений сторон (от стандартного 16:9 до вертикального 9:16 и кинематографичного 21:9).
  • Звук: Нативная генерация звука, интеграция контекстных эффектов и фоновой музыки прямо внутри модели.
  • Референсы: Поддержка от 1 до 7 референсных изображений для тонкого управления кадрированием и движением в кадре.

Цены на API Grok Imagine Video

Тарификация в API рассчитывается прозрачно — за секунду готового видео:

Услуга / РазрешениеСтоимость
Генерация 480p$0.08 за секунду
Генерация 720p$0.14 за секунду
Входное изображение$0.01 за штуку

Лимит составляет 60 запросов в минуту. Официальная страница модели со всеми техническими спецификациями и актуальными ценами находится ЗДЕСЬ.

Spicy Mode: Границы дозволенного и модерация

Отдельного внимания заслуживает политика контента. У Grok Imagine есть Spicy Mode, и по части работы со взрослым контентом платформа остается свободнее абсолютного большинства конкурентов на рынке.

Что разрешено: Откровенные позы, частичная обнаженность, интимное кадрирование и фэнтези-арт со взрослым подтекстом.

Что блокируется: Явные половые акты, порнография, дипфейки реальных людей, контент без согласия. Строго запрещена генерация любых персонажей, которые младше 18 лет или выглядят таковыми.

Модерация работает адаптивно. Важно понимать, что Spicy Mode лишь ослабляет часть фильтров, но не отключает модерацию полностью. Доступ к этому режиму платный и требует наличия подписки SuperGrok или X Premium+.

Также стоит учитывать нестабильность правил: промпт, который успешно работал на прошлой неделе, сегодня может легко улететь в блок. Разговоры про полное снятие цензуры в версии 1.5 — это скорее ожидания сообщества, чем факт. Официально про послабления в новой версии ничего не заявлено: текущее обновление целиком про качество и стабильность, а не про расширение границ дозволенного.

Гонка видеомоделей вошла в ту фазу, когда безоговорочный лидер меняется буквально каждый месяц. Еще вчера Seedance 2.0 был на технологической вершине, а сегодня его уже подвинули. Мы уходим детально тестировать Grok Imagine Video 1.5 в различных пользовательских сценариях и вернемся позже с подробными выводами.