Когда ИИ бесполезен: как мы создавали собственную анимацию

/users_files/wintramedia/2D_Videoblog_960-632.jpg

Чего хотелось

Задача звучала так: создать видео длительностью 15–20 секунд в стиле 2D-анимации, которое в двух словах пяти кадрах расскажет о комплексе наших услуг по созданию и продвижению сайтов.«Раз искусственный интеллект уже отлично рисует в любых стилях, почему бы ему не создавать видео», — подумали мы.

По запросам вроде «ИИ-генератор видео из текста» с легкостью находится не один десяток сервисов. При беглом знакомстве с ними все выглядело просто — пишем сценарий будущего шедевра, и искусственный интеллект подбирает красивый и гармоничный видеоряд, а также добавляет голосовое сопровождение и субтитры. Именно это показывают промо-ролики большинства ИИ-платформ.

Правда, насчет необходимости для нашей первой анимации аудиосопровождения были сомнения — основной ее функцией планировалось сделать добавление динамичности сайту. Но в любом случае хотелось освоить инструмент не для выполнения разовой задачи, а с прицелом на будущее, поэтому решили сразу найти сервис с поддержкой озвучки на русском языке.

/users_files/wintramedia/Fliki.jpeg

В итоге выбор пал на Fliki — платформа способна создавать видео на основе коротких текстовых промптов, готовых сценариев, информационных статей, PPT-презентаций, картинок и другого контента.

Даже без оплаты подписки предоставляются ежемесячно обновляемые 5 «минут кредитов», доступ к 300 голосам на более чем 75 языках, к тысячам исходников изображений и видео, а также к встроенному ИИ-генератору изображений.

Самая дешевая подписка за $28 в месяц, помимо стандартного для таких сервисов расширения возможностей, увеличивает количество «минут кредитов» до 180, что выглядит привлекательно на фоне аналогов.

Первые разочарования

Сразу после регистрации (можно войти через Google) на Fliki предоставляются два образца-черновика: видео и аудио. 

/users_files/wintramedia/Интерйес Fliki 1.png

Выбираем нужный формат, язык и просим ИИ Fliki создать видео на тему «Процесс создания и развития сайта: от макета до успешного проекта», указав основные этапы: разработка, продвижение, поддержка. Так как в приоритете — мультяшность, а в образцах — в основном примеры съемок из жизни, видеоряд доверили сгенерировать ИИ. В результате получилось это:

Из хорошего — ИИ правильно понял тему, создал вполне осмысленный текст на русском и неплохо его озвучил. Из плохого — видеоряд с примитивной анимацией и артефактами в худших традициях старых версий Stable Diffusion. Явно не то, чего хотелось.

При желании, видео можно доработать — скорректировать текст и звуковую дорожку, заменить фоновое видео, добавить новые элементы.

/users_files/wintramedia/Интерфейс Fliki.jpg

Но мы пришли клип в два клика с помощью ИИ генерировать, а не в видео-редакторе работать.

На этапе попыток редактирования выяснилась «прописанная мелким шрифтом» особенность Fliki: «минуты кредиты» — это именно выраженные в минутах внутренняя валюта сервиса, а не доступная длительность видео, как можно подумать.

Время списывается по тарифам за использование основных возможностей сервиса: от генерации голоса и картинок до экспорта. Поэтому бесплатные 5 минут — это совсем немного.

Нужны ли ИИ-генераторы видео?

Уже понимая, что Fliki — не то, что нам нужно, решили позволить ему взять реванш, и показать умения в основном направлении — генерации роликов с реальным видеорядом. Получилось так:

/users_files/wintramedia/fliki-3.mp4_20240413_011045.112.jpg

В целом — лучше, чем при использовании ИИ-генерации картинок, хотя обработка напильником нужна и здесь.

Мы знакомились с пробной версией Fliki. Не исключено, что при работе по подписке, когда, как заявляется, исходников в десятки раз больше, результат будет более впечатляющим. Если у кого-то есть опыт — будем рады узнать.

В целом, поизучав информацию еще о нескольких платформах по ИИ-генерации видео, поняли, что все они работают по одному принципу:

  1. Обрабатывают введенный промпт.
  2. Подбирают под «понятые» ими вводные видео или картинки из доступной им базы данных (как вариант — генерируют изображение самостоятельно).
  3. Формируют видеоряд, добавляя субтитры и аудио.

Главная проблема таких сервисов — ограниченный по определению объем исходников, из которых ИИ компонует видео. А в случае непосредственной ИИ-генерации видеоряда накладываются стандартные для рисующих нейросетей ограничения.

Поэтому сделать гармоничный ролик на тему здорового образа или успешного заключения договора несложно — здесь подойдут почти любые видео с улыбающимися красивыми людьми.

/users_files/wintramedia/sample-video-3-tips-to-help-you-lose-weight Образец .mp4_20240413_010747.467.jpg

Но с созданием чего-то специфичного — например, истории о SEO-продвижении или о работе АЭС — скорее всего, будут проблемы. Просто потому, что в базе данных видео-платформ нет достаточного количества материалов по узконаправленным тематикам. Тем более, все ИИ-сервисы, которые нам попались, оказались заточены под генерацию реалистичных видео, а не анимационных. Может, плохо искали?

Чем дальше в лес…

Что ИИ-генераторы видео нам не помогут мы осознали, но без красивой анимации на сайте оставаться не хотелось. Впрочем, процесс изучения видео-платформ не был лишним — он помог понять, что именно нам нужно. Чем конкретнее вопрос, тем проще получить правильный ответ, и мы нашли его в сервисе Renderforest. Он позиционирует себя как единая платформа для дизайна. Здесь действительно много полезных инструментов — можно создавать:

  • видеоролики, включая анимационные;
  • логотипы;
  • мокапы;
  • инфографику;
  • сайты.

Принцип работы прост: выбираем подходящий набор шаблонов из тысячи доступных, компонуем видеоряд из подходящих, настраиваем их под себя, добавляем озвучку — и получаем именно то, что нужно:

/users_files/wintramedia/Первое видео RenderForest.mp4_20240413_010546.989.jpg

Но на самом деле, это лишь начальный вариант, созданный за несколько минут из первого попавшегося шаблона.

Да, здесь нужно работать головой и руками — самому подбирать подходящие исходники.

Но в случае с узкоспециализированной темой, как digital, добиться желаемого результата оказалось проще и быстрее, чем с помощью ИИ.

Не в последнюю очередь — благодаря интуитивно понятному интерфейсу и понятливому быстрому поиску. Что еще понравилось в Renderforest:

  • Фактически безлимитный бесплатный тариф — можно создавать и скачивать сколько угодно видео в пределах 500 МБ выделенного облачного пространства, не задумываясь, сколько «кредитов-минут» заберет добавление дополнительного слайда. Естественно, видео будут в разрешении только 360p и с водяным знаком, а некоторые функции, например, встроенные генератор речи из текста и премиум-слайды применить не удастся. Но нам это не помешало перепробовать с полдюжины стилей и найти подходящий вариант еще до оплаты подписки.
  • Большое количество тематических шаблонов, в том числе с индивидуальной настройкой цветовой схемы и шрифта текста в соответствии с брендбуком компании.
  • Прием платежей через ЮКассу. То есть оплатить подписку можно с любой российской банковской картой или, например, с Юmoney.
  • Полностью русифицированный интерфейс и объемный блог с хорошими подборками и подробными инструкциями — именно тут мы, кстати, и нашли задействованный в итоговой версии видео шаблон.
  • Низкие цены — месячная подписка Lite, предоставляющая полноценный доступ ко всем ключевым возможностям платформы стоит всего 1399 р. (999 р. при оплате за год). А еще можно разово заплатить за скачивание одного видео в высоком качестве без водяных знаков.

Из того, что хотелось бы улучшить, можно выделить:

  • Достаточно ограниченный выбор шаблонов с возможностью настройки цветовой схемы и плавных переходов между слайдами. Нам, например, пришлось искать компромисс между стилем рисовки и цветовым оформлением видео.
  • Всего 2 русскоязычных голоса у встроенного генератора речи. Впрочем, эта проблема легко решается сторонними сервисами — их много, в том числе бесплатных. Например, на APIHOST можно сделать озвучку на русском языке в 17 вариантах с нужными ударениями и паузами даже без регистрации.
  • Отсутствие выбора формата выгрузки видео — доступно только .mp4 и несколько фиксированных разрешений, зависящих от подписки. Поэтому пришлось отдельно конвертировать видео в .webm и обрезать под нужный размер.

Но в итоге желаемого результата мы добились — и теперь посетителей главной страницы нашего сайта wintramedia.ru встречает вот такая 25-секундная анимация:

/users_files/wintramedia/Заглавная.png

Скорее всего, аналогичные «мультики» будут появляться и на других страницах нашего сайта, в блогах, а также — на веб-ресурсах наших клиентов.

Бонус: как не работает ИИ

Renderforest тоже осваивает искусственный интеллект. Сейчас платформа предлагает ИИ-генерацию бизнес-имен, лого и сайтов. А еще функция ИИ доступна в некоторых шаблонах анимационных видео: набор слайдов для видео генерируется по текстовому сценарию. Последняя функция работает так себе, мягко говоря. Если кратко — проще подобрать слайд вручную.

Например, если задать описание истории об автосервисе:

/users_files/wintramedia/Screenshot 2024-04-11 at 13-26-39 редактор видео 3.png

Получаем это:

/users_files/wintramedia/Автомобиль едет по дороге.mp4_20240413_010355.906.jpg

Хотя в наборе шаблонов есть куда более релевантные слайды:

/users_files/wintramedia/Screenshot 2024-04-11 at 13-32-57 редактор видео 3.png

Причем даже если в промпте прописать прямым текстом их названия, ситуация не изменится.

И это в очередной раз подтверждает наше мнение: до создания узкоспециализированных видео искусственный интеллект не дорос. По крайней мере, пока. Или мы ошибаемся? Пожалуйста, делитесь вашим опытом в комментариях.