Видео из фото: AI-генерация для маркетплейса

Видео из фото для маркетплейса — обложка статьи с пайплайном AI-генерации товарных роликов из карточки

Селлер натуральной косметики на Wildberries в начале 2025 года платил видеографу 30 000 ₽ за съёмочный день и получал 8 готовых роликов для соцсетей и карточек товара. Через год тот же селлер выпускал 1 000 роликов в месяц через AI-генерацию из существующих продуктовых фото — по 119 ₽ за публикацию. CTR карточек на WB вырос с 2,1% до 4,8%, бренд-запросы — в 2,3 раза. Видео из фото для маркетплейса — это не «оживлённая открытка», а полноценный конвейер: нейросеть берёт статическое фото товара, добавляет движение, фоновые эффекты, переходы, закадровый голос или субтитры — и выдаёт ролик длиной 5–30 секунд, готовый для VK Клипов, YouTube Shorts, Дзен и Telegram. Разбираю как это устроено технически, сколько стоит и какие форматы дают селлеру максимальный эффект.

Съёмка с оператором vs AI-видео из фото: было → стало
МетрикаСъёмочная командаAI-видео из фото
Цена 1 ролика3 750 ₽ (30К/день ÷ 8 шт)119 ₽ (×31 дешевле)
Объём в месяц40–60 роликов1 000+ роликов
Срок запуска3–4 недели3 дня
Что нужно от клиентаДоставить товар, организовать смену10–30 продуктовых фото с маркетплейса
CTR карточки на WB2,1%4,8%
Стоимость 1 просмотра1,2 ₽0,1 ₽ (×12 эффективнее)
Бренд-запросы в ЯндексеБаза×2,3 за 3 месяца

Что такое видео из фото и почему оно работает на маркетплейсе?

Видео из фото — это короткий ролик (5–30 секунд), который нейросеть генерирует из одного или нескольких статических изображений: продуктового фото с маркетплейса, фотографии из каталога, рендера из 3D-редактора. На входе — обычная карточная фотография; на выходе — динамичный ролик с движением камеры, добавленным фоном, переходами, эффектами текстур, закадровым голосом или текстовыми подписями.

По данным Data Insight, число активных селлеров на российских маркетплейсах в 2025 году превысило 700 тысяч, а доля карточек товаров с видео в карусели на Wildberries за год выросла на 47%. Алгоритмы WB и Ozon ранжируют карточки с видео выше — это уже не гипотеза, а статистика выдачи. По данным АКИТ, доля видеоконтента в потреблении российских e-commerce пользователей в 2025 году достигла 64% от общего времени, проведённого в категориях товаров.

До появления AI-генерации видео из фото селлер выбирал между двумя плохими вариантами: нанимать видеографа (3 000–5 000 ₽ за ролик), либо делать видео самому в редакторе (бесплатно, но 2–3 часа на ролик и низкое качество). AI-видео из фото снимает эту дилемму — селлер получает поток роликов по 119 ₽ за публикацию, не тратя ни времени на съёмку, ни денег на оператора. Подробнее про контент-завод для маркетплейсов.

Главное преимущество для селлера — масштаб. Один продуктовый артикул превращается в 20–50 разных коротких роликов под VK Клипы, YouTube Shorts, Дзен, Telegram, RUTUBE, Likee, TenChat. Каждая площадка получает свою версию, оптимизированную под её алгоритм и форматы. По данным Tadviser, средний российский потребитель использует 4–6 социальных платформ ежедневно — присутствие одного бренда сразу на нескольких из них умножает узнаваемость без линейного роста бюджета.

Какие нейросети генерируют видео из фото в 2026 году?

Технологический ландшафт AI-генерации видео в 2026 году выглядит совершенно иначе, чем два года назад. Из «игрушки для энтузиастов» (5-секундные глючные ролики Runway Gen-1 в 2023-м) технология превратилась в зрелую индустрию с несколькими топовыми движками, у каждого из которых есть своя ниша.

ДвижокСильная сторонаГде работает лучше всего
Runway Gen-3 AlphaКинематографичное движение камерыПремиум-сегмент, лайфстайл, fashion
Pika 2.0Анимация деталей предметаКосметика, FMCG, продукты питания
Kling 1.6Длинные ролики (10+ сек), физика жидкостейБытовая химия, напитки, текстуры
Hailuo MiniMaxРеалистичные люди в кадреОдежда, обувь, аксессуары (с UGC клиента)
Luma Dream MachineСкорость, дешёвая генерацияМассовый поток для соцсетей, тесты
Стабильные русские моделиЛокальная инфраструктура, без VPNРезервный канал, чувствительные ниши

В контент-заводе на ИИ мы не привязаны к одной нейросети: пайплайн оркестрирует 5–7 движков параллельно. Это даёт два эффекта. Первый — устойчивость: если один движок упал или подорожал, переключаемся на альтернативу за 5 минут. Второй — качество: каждый ролик отправляется на тот движок, который лучше всего справляется с конкретной задачей (для распаковки косметики — Pika, для динамики напитка в стакане — Kling, для лайфстайл-сценки — Runway).

Самостоятельная работа селлера с одной нейросетью почти всегда упирается в потолок: один движок хорош в одном, плох в другом. Поток роликов под разные категории товаров требует комбинации. Это одна из причин, почему ручная сборка контента в нейросетях даёт результат, заметно слабее организованного пайплайна — даже когда селлер тратит на это часы.

Как устроен пайплайн AI-видео в контент-заводе?

В контент-заводе AI-видео из фото — это не «загрузил фото — нажал кнопку — получил ролик», а конвейер из 5 этапов с разными нейросетями и редакторской логикой между ними.

Этап 1 · Подготовка продуктовой картинки

Берём исходное фото с карточки маркетплейса или из каталога клиента. Очищаем фон (через background-removal-модели), пересобираем сцену под нужную композицию ролика — товар на столе, в руках, в естественной среде использования. Иногда генерируем дополнительные ракурсы или вариации цвета — чтобы один артикул дал серию роликов, а не одну анимацию.

Этап 2 · Генерация движения и сцены

Передаём подготовленную картинку в video-движок (Runway, Pika, Kling — в зависимости от категории). Задаём промпт: «крем вращается на белом мраморе при мягком естественном свете, рука открывает крышку, появляется текстура продукта». Получаем 5–10 секунд исходного материала. Параллельно генерируется 3–5 вариантов одного промпта — лучший отбирается на следующем этапе.

Этап 3 · Озвучка, субтитры, текстовые вставки

К визуальной части добавляется звуковой слой: AI-голос (закадровый комментарий с описанием продукта, цена, оффер) или просто текстовые подписи в стиле платформы (TikTok-style, Reels-style*). Для Дзена обязательно длинный заголовок плюс закадровый рассказ — это даёт прирост дочитываемости до 40%. Для VK Клипов наоборот — короткие хлёсткие подписи и быстрые перебивки.

Этап 4 · Адаптация под форматы платформ

Один ролик превращается в 6–10 версий: 9:16 для Shorts/Клипов, 1:1 для лент VK и Telegram, 16:9 для Дзена и YouTube. Длительность тоже разная: 15 сек для импульсных платформ, 30–60 сек для образовательных. Бренд-идентификаторы — логотип, цветовая палитра, фирменный шрифт — добавляются автоматически из брендбука клиента.

Этап 5 · Уникализация и публикация

Чтобы алгоритмы не помечали ролики как дубли, каждая копия проходит через слой уникализации: микро-сдвиг кадра, изменение длительности на 0,2–0,5 сек, лёгкая фильтрация цвета, разный закадровый голос. Готовый поток уходит в систему мультипостинга — публикации расписываются по аккаунтам и площадкам, чтобы каждый канал получал 3–7 роликов в день в нужное локальное время.

Весь пайплайн обслуживают 7 AI-агентов плюс команда редакторов. Селлер видит на входе чек-лист «нужны фото и описание ниши», на выходе — поток публикаций и еженедельный отчёт. Подробный разбор 7 AI-агентов.

Сколько стоит видео из фото и как считать ROI?

Главный CTR-крючок проекта — от 119 ₽ за публикацию. Это цена одного ролика в пакете 10 аккаунтов (119 000 ₽/мес ÷ ~1 000 публикаций). С ростом тарифа цена за публикацию падает.

ТарифЦена/месРоликовЦена за роликДля кого
10 аккаунтов119 000 ₽~1 000119 ₽1 ниша, тест гипотез, 1 категория товара
20 аккаунтов ⭐179 000 ₽~2 000~90 ₽2–3 категории, основной канал бренда
40 аккаунтов319 000 ₽~4 000~80 ₽Мультикатегория, лидер ниши на WB/Ozon
50+ аккаунтовПо запросу10 000+от 70 ₽Промышленный масштаб, маркетплейс-холдинг

ROI считается так: средний приход одного просмотра на карточку конвертируется в покупку с конверсией 1,5–3% при чеке 1 500–3 000 ₽. На пакете 20 аккаунтов мы получаем 2 000 публикаций в месяц с суммарным охватом 8–20 млн просмотров. Даже при консервативной воронке (1% досмотров → переход на карточку → 1,5% конверсия в покупку) пакет окупается за 1–2 месяца при цене товара от 1 000 ₽.

Для сравнения: услуги видеографа стоят от 3 750 ₽ за ролик (если делать со студийной командой) и не масштабируются — за месяц физически невозможно снять 1 000 роликов одним брендом. Контент-завод на видео из фото переводит производство из режима «штучная съёмка» в режим конвейера. Калькулятор ROI с детальными переменными.

Какие форматы видео из фото работают на WB и Ozon?

Не все ролики одинаково эффективны на маркетплейсах. После запуска сотен AI-видео в товарных нишах мы зафиксировали 5 рабочих форматов и 2 проваливающихся.

  • Распаковка из фото. Видео имитирует получение посылки и открытие упаковки. Работает в косметике, FMCG, электронике, детских товарах. Зрителю показывают «то, что он получит», — это снимает страх покупки незнакомого товара на маркетплейсе.
  • Сценка применения. Один кадр — продукт в момент использования: крем наносится на руку, чехол надевается на телефон, посуда расставляется на столе. Самый универсальный формат, работает в любой товарной нише.
  • Сравнение «было / стало». Раздваиваем кадр или показываем последовательно: до применения продукта — после. Особенно эффективен в категориях ухода (косметика, бытовая химия, ремонт обуви, чистящие средства).
  • Динамика текстуры. Крупный план продукта с фокусом на материал, текстуру, цвет, движение жидкости. Минимум сюжета — максимум сенсорики. Работает на «импульсные» категории, где решение о покупке принимается за 3–5 секунд.
  • Лайфстайл-фон. Продукт встроен в «жизненную» сцену: на кухонном столе утром, в ванной, в дороге, на работе. Зритель видит контекст использования. Работает в FMCG, мебели, аксессуарах, текстиле.

Проваливаются: «вращающаяся карусель товара» (выглядит как реклама из 2010-х — алгоритмы режут охват) и «AI-сцена, в которой человек разговаривает с продуктом» (попадает в зловещую долину). Эти форматы мы не запускаем по умолчанию.

В кейсе бренда товаров для дома (D2C, NDA) лайфстайл-формат дал 2,8 млн охватов за 4 недели и ×3 рост брендовых запросов в Яндексе и на маркетплейсах. Артикульные переходы на карточки выросли на 38%. По нашим наблюдениям, лаг между показом ролика и пиком брендовых запросов — около 5–10 дней. Гайд по внешнему трафику для WB.

Что делать с продуктовыми фото — какие подходят?

Не каждое фото из карточки даёт хороший AI-ролик. Перед тем как загружать в пайплайн, мы пропускаем все фото через 3 фильтра.

  1. Разрешение от 1500 пикселей по короткой стороне. Маленькие фото (типичные превью с WB 600×600) недостаточны: AI генерирует движение, но детали при апскейле плывут. Лучший результат — фото 2000–4000 пикселей.
  2. Чистый фон или контрастный объект. Если товар сливается с фоном, нейросеть «теряет» границы объекта и анимация выглядит ломано. Идеально — белый или одноцветный фон, либо чёткий контур товара на сложном фоне.
  3. Один ракурс — одна задача. Не пытаемся в одном ролике показать товар «с трёх сторон одновременно». Берём 1 ракурс — генерируем ролик, потом другой ракурс — другой ролик. Так пайплайн даёт стабильное качество.

Если у клиента нет нормальных фото — мы рекомендуем перед запуском контент-завода обновить фото на карточке маркетплейса. Это не наша услуга (мы не снимаем товар), но дальше в работе мы поможем с обработкой и пересборкой существующих фото в новые ракурсы через AI-инпейнтинг.

Из 10–30 продуктовых фото на входе пайплайн выдаёт 200–600 уникальных роликов в месяц на пакете 20 аккаунтов. Один артикул живёт в контенте 2–3 месяца, после чего идёт обновление пула фото — обычно совпадает с новой коллекцией или сезонным обновлением каталога.

Чем видео из фото отличается от UGC и AI-персонажей?

На карточке маркетплейса и в соцсетях бренда работают три типа видеоконтента, которые часто путают. Разберу различия.

ТипЧто этоЦена 1 роликаВремя на 1 ролик
UGC от блогераЖивой человек снимает на телефон распаковку или применение800–3 000 ₽3–14 дней (с поиском блогера)
AI-персонажВиртуальная героиня бренда, ведёт серию роликовот 119 ₽1 час в конвейере
Видео из фотоАнимация существующего фото товара (без персонажа)от 119 ₽15 минут в конвейере

UGC — самый «человеческий», но не масштабируется и дорогой. Подробнее про UGC vs реклама. AI-персонаж — узнаваемая героиня, которая ведёт серию контента; работает на удержание аудитории. 7 форматов AI-персонажей. Видео из фото — самый «нейтральный» формат: в кадре нет лица, только товар. Это его сила (низкая цена, быстрая генерация, не нужен сценарий героини) и его слабость (ниже вовлечённость, чем у роликов с людьми).

Оптимальная стратегия для маркетплейс-селлера — комбинация. На тарифе 20 аккаунтов мы обычно делаем так: 50% объёма — видео из фото (продуктовый поток на карточки), 30% — AI-персонаж (узнаваемое лицо бренда), 20% — уникализация существующего UGC клиента, если он у него есть.

Как масштабировать AI-видео на 10+ площадок?

Один AI-ролик из фото — это сырьё. Чтобы он работал на маркетплейс-селлера, ролик должен попасть на правильные площадки в правильное время в правильной форме.

  • VK Клипы. Вертикальный формат 9:16, длительность 15–30 сек, музыкальный трек, динамичная подача. Один из основных источников внешнего трафика на WB и Ozon в 2026 году.
  • YouTube Shorts. Похож на VK Клипы по требованиям, но алгоритм отбирает по retention rate первых 3 секунд — пайплайн ставит «хук» в начале каждого ролика.
  • Дзен. Длинные ролики (60–180 сек) с закадровым голосом или статьёй. Дзен ценит дочитываемость — туда заходят более развёрнутые форматы, не короткие нарезки.
  • Telegram-каналы и боты. Telegram любит «нативные» вертикальные ролики 15–60 сек с подписью-историей. Хорошо работают серии — пользователь подписывается ради продолжения.
  • RUTUBE, Likee, TenChat, Yappy. Дополнительные платформы для распыления трафика. Алгоритмы новые, конкуренция ниже — низкий вход для нового бренда.
  • Reels*. Если у бренда есть аудитория в Reels — пайплайн адаптирует формат, но это второстепенная площадка после блокировки Meta* в России.

Ключевое для маркетплейс-селлера — не «зайти на одну площадку», а присутствовать на 5–8 параллельно. По данным Tadviser, среднее количество соцплатформ, которыми пользуется российский потребитель ежедневно, — 5,2. Один и тот же зритель видит ролики бренда в VK Клипах с утра, в Дзене за обедом, в Telegram вечером — и через 5–7 контактов запоминает продукт. Внешний трафик на Ozon через короткие видео.

Где видео из фото проваливается и не даёт эффекта?

Есть категории и ситуации, в которых AI-видео из фото — не оптимальный инструмент, и мы честно об этом говорим.

  • Премиум-сегмент с упором на статус. Часы за 200 000 ₽, ювелирка, дизайнерская мебель — здесь покупатель ожидает «человеческой» истории, личного контакта, эксклюзивности. Видео из фото может восприниматься как удешевление.
  • Категории, где важна физическая демонстрация. Спортивная экипировка, музыкальные инструменты, спецтехника — нужна реальная съёмка с человеком, чтобы покупатель увидел «как это работает руками».
  • Одежда без UGC клиента. Одежда требует динамики на живой модели. AI-видео из фото одежды на манекене даёт слабый результат. В этой нише мы работаем только с клиентами, у которых уже есть собственный поток UGC-роликов — мы их уникализируем и масштабируем, а AI-видео добавляем как дополнительный слой обзоров.
  • B2B SaaS, эксперты, инфобиз. Не наш сегмент. Длинный цикл продаж, экспертный маркетинг, нужны кейсы и whitepapers — не короткие ролики.
  • Слабая карточка товара. Если карточка плохо собрана (плохие фото, слабое описание, нерелевантное название) — AI-видео усилит то, что есть, но не компенсирует системные провалы. Перед запуском контент-завода мы даём рекомендации по карточке, но не переделываем её за клиента.

Для всех остальных товарных ниш на WB и Ozon — косметика, БАДы, FMCG, бытовая химия, товары для дома, детские товары, аксессуары, кухня, текстиль, инструменты, электроника — видео из фото работает как массовый инструмент привлечения внешнего трафика.

С чего начать селлеру маркетплейса прямо сейчас?

Чтобы запустить пайплайн AI-видео из фото на свой бренд, селлеру маркетплейса нужно подготовить три вещи и одну встречу.

  1. 10–30 продуктовых фото в нормальном качестве. Можно прямо с карточек WB или Ozon (если разрешение 1500+ пикселей), можно из ваших съёмок. Минимум 3–5 разных ракурсов одного товара.
  2. Краткое описание ниши и ЦА. 1–2 абзаца: что продаёте, кому, какая средняя цена товара, какие конкуренты. Это вход для стратегии — не маркетинговый план на 100 страниц.
  3. 2–3 эталона. Каналы, бренды, ролики, чей tone of voice вам нравится. Не обязательно из вашей ниши — мы адаптируем стиль.

На стратегической консультации (45 минут, бесплатно) мы разбираем нишу, оцениваем потенциал видео из фото в вашем сегменте, выбираем рекомендуемый тариф и согласовываем 2–4 формата роликов под старт. На 3-й день после согласования стратегии в эфире — первые публикации. Через 1–2 недели — первые охваты. Через 4–6 недель — первые сдвиги в брендовых запросах и переходах на карточку.

Главное про видео из фото для маркетплейса

  • Видео из фото — это короткий ролик (5–30 сек), который AI генерирует из статического продуктового фото с маркетплейса.
  • Цена 1 ролика — от 119 ₽ против 3 750 ₽ за ролик у видеографа (×31 дешевле).
  • Объём — 1 000+ роликов в месяц на пакете 10 аккаунтов вместо 40–60 при ручной съёмке.
  • CTR карточек на WB растёт с 2,1% до 4,8%, бренд-запросы — в 2,3 раза за 3 месяца.
  • 5 рабочих форматов: распаковка, сценка применения, «было / стало», динамика текстуры, лайфстайл-фон.
  • 2 проваливающихся формата (вращающаяся карусель и «AI-разговор с продуктом») мы не запускаем.
  • Пайплайн комбинирует 5–7 нейросетей (Runway, Pika, Kling, Hailuo, Luma) под разные категории.
  • Стартовый чек-лист: 10–30 фото в 1500+ пикселей + описание ниши + 2–3 эталона.

Частые вопросы

Можно ли AI-видео из фото публиковать в карточке товара на WB и Ozon?+

Да, можно. Wildberries и Ozon в 2026 году не запрещают AI-сгенерированный контент в карточках, при условии что на видео реальный товар и нет вводящих в заблуждение сцен (например, нельзя показывать функции, которых у товара нет). Мы рекомендуем использовать AI-видео в карусели карточки как дополнение к основному видео-обзору — это улучшает поведенческие метрики и повышает CTR в выдаче. Главное — соответствие реальному товару и его характеристикам.

Что нужно от селлера для запуска AI-видео из фото?+

Минимум — 10–30 продуктовых фото в разрешении 1500+ пикселей по короткой стороне (можно с карточек маркетплейса), краткое описание ниши и целевой аудитории, 2–3 эталона стиля. Не нужно: снимать собственное видео, писать сценарии, делать монтаж, согласовывать каждый ролик. Один продуктовый артикул в пайплайне даёт 20–50 уникальных роликов под 5–8 платформ. Обновление пула фото обычно совпадает с новой коллекцией или сезонным обновлением каталога.

Сколько времени до первых результатов от AI-видео из фото?+

Первые публикации выходят на 3-й день после согласования стратегии. Первые охваты появляются на 1–2 неделе. Заметные сдвиги в брендовых запросах в Яндексе и переходах на карточку маркетплейса — на 3–6 неделе. Стабильные изменения по продажам — на 2–3 месяце. Полная разгонка ниши через AI-видео — 6–8 месяцев. Конкретные цифры зависят от ниши, цены товара, силы карточки — это мы предварительно оцениваем на стратегической консультации.

Евгений Карасев — основатель ЗАПУСКИ
Евгений Карасев
Основатель «ЗАПУСКИ» — контент-завода на ИИ. Помогает авторам и брендам продвигать книги, товары и приложения через системный контент в соцсетях.
Узнать подробнее

Полезные материалы:

* Meta признана экстремистской организацией на территории РФ. Instagram и Facebook принадлежат Meta и запрещены в России.

Готовы запустить AI-видео из фото
от 119 ₽ за публикацию?

Оставьте заявку — рассчитаем тариф под вашу нишу и подберём 3–4 формата AI-видео из ваших продуктовых фото за 1 рабочий день

или напишите в Telegram

Читайте также

AI-персонажи бренда: 7 форматов

Виртуальные герои для соцсетей товарки.

Контент-завод для маркетплейсов

Полный разбор услуги под WB и Ozon.

UGC-видео для карточки товара

Сравнение с AI-видео и расчёты ROI.