Как начать работать с нейросетями: о дороге
к инновациям через
скептицизм


Кирилл Борисов,
CEO KINEMOTOR Production

АКТУАЛЬНО | КОЛОНКА
03.10.2024
Нейросети, которые появились в широком доступе совсем недавно, быстро прошли путь от «сырой» технологии к инструменту, способному изменить все креативное производство. Такого мнения придерживаются эксперты передового видеопродакшена KINEMOTOR Production. CEO компании Кирилл Кириллов рассказал NewBiz Media, как именно ИИ изменил привычные элементы процесса создания контента.

Первые шаги и эксперименты

Долгое время наша компания, как и многие другие, относилась к нейросетям с изрядной долей скептицизма. Конечно, как и все вокруг, мы иногда баловались с популярными приложениями и фильтрами. Кто не примерял забавные маски в Instagram* (Meta объявлена экстремистской организацией на территории РФ — Прим. ред.) или не задавал вопросы ChatGPT? Но все это казалось скорее развлечением, чем серьезным инструментом для бизнеса.

Скептицизм основывался на нескольких факторах. Во-первых, у нас не было доверия к качеству контента, производимого ИИ – казалось, что делать продукт, соответствующим нашим высоким стандартам, нейросеть не сможет. Во-вторых, нужно было встроить эти новые технологии в наши существующие рабочие процессы.

Несмотря на эти сомнения, мы решили не игнорировать новую технологию, а изучить ее потенциал. Поэтому мы продолжали эксперименты и раз в год тестировали нейросети, проверяя, смогут ли они повторить оригинальную обложку нашего клипа.

Сегодня Midjorney делает обложку даже лучше оригинала.

Мы использовали Midjourney для создания концепт-артов, постепенно отказываясь от услуг художников.

Наши концепт-арты в сравнении с ранними моделями генеративного ИИ

(справа ИИ, слева наши концепт-арты)

Еще у нас был проект, где мы применяли нейросети для создания визуальных эффектов. Но это воспринималось скорее как просто тестовый вариант, своего рода «шаманство».

Мы также попробовали использовать ИИ для очистки кадров в одном крупном проекте и даже создали 3D-модель известного блогера с помощью программы, в которую были встроены нейросети. Но все эти попытки нельзя было считать системным подходом, поэтому и как нечто серьезное они не воспринимались.

SORA как революция в производстве

Настоящий прорыв произошел, когда в начале 2024 года компания Open AI продемонстрировала возможности новой нейросети SORA. Презентация поразила всех, в том числе и нас. Появление такого инструмента означало, что теперь, значительно экономя время и человеческий ресурс, можно создавать контент, почти неотличимый от реальности.
Мы впервые увидели, что нейросети способны произвести нечто действительно близкое к тому, что раньше можно было сделать только с помощью либо реальной камеры, либо компьютерной графики. Это заставило нас задуматься о революции, которая происходит прямо на наших глазах.
История кинематографа насчитывает уже более ста лет. Конечно, за это время изменились производственные мощности. Если в 1896 году братья Люмьер шокировали публику кадрами прибытия поезда в не самом лучшем качестве, то в 2024-м The Weeknd снял клип на песню “Dancing In The Flames" в куда лучшем разрешении с помощью простого смартфона. Впрочем, что уж клип — режиссер Дэнни Бойл недавно закончил работу над фильмом «28 лет спустя», который полностью снят на iPhone. И это не первый подобный кино-эксперимент.

Еще одной вехой в развитии кинематографа стала компьютерная графика, которая начала активно использоваться в кино в начале 1990-х годов. Так, Джеймс Кэмерон всегда был техногиком, а начинал как дизайнер спецэффектов. Поэтому его фильмы всегда были полигоном для инноваций. Яркий пример – «Терминатор 2», где Кэмерон использовал революционные CGI-эффекты для создания жидкого T-1000. Это был прорыв в визуальных эффектах своего времени. Следом вышел «Парк Юрского периода» (1993), продемонстрировавший революционные для своего времени визуальные эффекты. Однако даже с появлением CGI, большая часть фильма все равно снималась традиционным способом, а графика часто выглядела несовершенной.

И все-таки с момента зарождения кино в конце XIX — начале XX века основные принципы создания фильмов, несмотря на значительный прогресс самих инструментов, остались неизменными. До сих пор мы продолжали фиксировать с помощью камеры, впоследствии дорабатывая изображение на этапе монтажа. Суть оставалась прежней — мы запечатлевали то, что происходит перед объективом.
Сейчас же мы стоим на пороге настоящей революции. Генеративный искусственный интеллект кардинально меняет правила игры. Теперь один человек с ноутбуком может создавать контент такого уровня сложности, который раньше был доступен только крупным студиям с миллионными бюджетами.
Это не просто очередной этап эволюции киноиндустрии, но настоящий переворот. Впервые за более чем столетнюю историю кино мы можем создавать визуальный контент, практически не ограниченный реальностью. ИИ генерирует сцены, персонажей, целые миры, которые выглядят неотличимо от настоящих, но при этом полностью создаются в виртуальном пространстве.

Как нейросети облегчили работу видеопродакшена

Важным этапом стало мое знакомство с Дмитрием Крапивницким, CEO OMNIMIX digital agency на одном из мероприятий MarCom Club, который специализируется на языковых моделях и интеграции ИИ в бизнес-процессы. Его подход и мышление меня сильно вдохновили. Финальной точкой стало его выступление на конференции, после которого я окончательно убедился в необходимости глубокого погружения в тему.
Со временем у нас сформировалось целое сообщество энтузиастов — сотрудников, бывших коллег, режиссеров, — которые так же увлеклись темой ИИ. Наш чат, посвященный новостям о нейросетях, стал самым активным среди корпоративных чатов. Мы постоянно обсуждали новинки, делились опытом и экспериментировали. Сейчас я делюсь результатами в нашем телеграм-канале, где рассказываю как мы делали полностью сгенерированные ролики, фотореалистичные изображения, экспериментировали с обложками, и, наконец, 3D-графику с помощью нейросетей.

Когда мы накопили довольно крупную базу знаний, встал вопрос: как мы можем применить эту информацию в нашем бизнесе? Мы — продакшн-компания, поэтому мы искали способ интегрировать ИИ в производственные процессы. Мы начали работать с разными методами генерации контента, пытаясь понять, что подходит для нашей сферы, а что нет.
Одним из первых успешных применений стала генерация превью будущих проектов для клиентов. Раньше мы тратили много времени на создание концепт-артов или использовали референсы, которые не всегда точно отражали нашу идею. Теперь быстро создаем визуализации, генерируем голос для озвучки и музыку. Эту технологию мы впервые использовали в проекте «ПАЦАНКИ». Сначала мы сделали предварительный вариант ролика с помощью нейросетей. Если сравнить этот набросок с итоговым результатом, легко заметить, что многие идеи получилось успешно перенести в реальные съемки.
Финальный ролик «Пацанки»
Набросок ролика «Пацанки» с применением ИИ
Еще мы экспериментировали с организацией ИИ-производства некоторых элементов, которые до этого снимали сами. Правда, здесь мы столкнулись с определенными ограничениями. Качество генерируемого контента не всегда соответствует нашим высоким стандартам, а контроль процесса производства на том же уровне, что и при традиционной съемке с реальными людьми, пока невозможен.

Но мы постоянно совершенствуем подход, а нейросети развиваются — что-то новое появляется каждую неделю. Наш подход заключается в том, что мы удешевляем производство в некоторых сценах, где использование нейросетей выгоднее традиционных съемок. По моим расчетам, так можно сэкономить до нескольких миллионов рублей при производстве больших рекламных роликов. Пусть не все, но многое уже можно делать с помощью ИИ на высоком уровне. Например:
  • визуальные эффекты в кадре (пример),
  • рекламные фуд-съемки (первый и второй примеры),
  • неотличимые от реальных кадров портретные и натуралистичные сцены - пример с «Пацанками».

Взгляд в будущее

Я прогнозирую, что через 2-3 года часть проектов мы будем производить полностью с помощью ИИ. Это не значит, что традиционные методы производства исчезнут. Скорее, мы найдем баланс между классическим подходом и новыми технологиями.

Конечно, очень многое зависит от клиентов. Распространение ИИ-технологий сдерживает инерция и недоверие к новым инструментам вроде нейросетей, да и просто привычка. Я надеюсь, что мы сможем поменять эту ситуацию, делая качественный контент.

Внедрение нейросетей в работу — непрерывный процесс обучения и адаптации. Мы постоянно сталкиваемся с новыми вызовами: необходимость постоянного обучения, ограничения текущих инструментов, поиск способов сохранения творческого подхода. Но мы уже видим огромный потенциал и уверены, что эти технологии изменят индустрию кино и видеопроизводства в ближайшем будущем. Наша цель — не заменить человека машиной, а дать творческим людям новые инструменты для реализации любых идей.

Больше информации в нашем телеграм-канале. NewBiz Медиа — проект о новом лидерстве, лучших бизнес-практиках, аутентичном управлении и уверенном выборе решений, определяющих будущее брендов и отрасли.