Алгоритмы нейросетей для создания визуального контента быстро совершенствуются. Хотите попробовать себя в создании видео с помощью искусственного интеллекта, но не знаете с чего начать? Mochi 1 от Genmo — сервис на базе ИИ, который помогает превращать текстовые запросы в короткие видео. Здесь мы предлагаем пошаговую инструкцию по регистрации в нем. А в этой статье мы разберем возможности нейросети на конкретных примерах.
На сайте genmo.ai можно бесплатно испробовать функции Mochi 1. Лимит на бесплатное использование обновляется раз в сутки.
Что такое Mochi 1 и ее возможности
Модель искусственного интеллекта для генерации видео с открытым кодом Mochi 1 была разработана компанией Genmo. Модель способна создавать качественные видеоролики из текстовых описаний с частотой 30 кадров в секунду. Особенности нейросети:
- Высокое качество движения. Mochi 1 подходит для создания динамических видео с людьми, потому что генерирует плавные, естественные движения.
- Точное соответствие запросам. Модель использует передовые алгоритмы и хорошо преобразует текстовые описания в детализированные видеоролики, которые соответствуют задумке пользователя.
- Открытый исходный код. Платформа доступна по лицензии Apache 2.0. Разработчики и пользователи могут свободно скачивать и модифицировать модель для своих нужд.
- Гибкость в использовании. Нейросеть подходит для различных сфер применения: маркетинг, образование, творчество и создание контента для социальных сетей.
Весь спектр настроек и функций Mochi 1 можно использовать, если развернуть проект на локальном компьютере. Для локального запуска модели требуется наличие как минимум 4 графических процессоров H100. Такие возможности есть не у всех. Поэтому мы воспользуемся онлайн-платформой genmo.ai, которая предоставляет доступ к Mochi 1 без установки. Текущая версия модели генерирует видео с разрешением 480p, с планами по поддержке 720p в будущих обновлениях. Платформа способна создавать видеоролики длительностью до 5,4 секунд.
Практические примеры использования Mochi 1
Создание видео по текстовому запросу
Открываем сайт genmo.ai/play, авторизуемся по аккаунту Google. Промты в Mochi 1 лучше писать на английском языке.
1. Пишем промт: «A wide-angle shot of children flying kites on a hilltop, kites soaring high. The camera pans across the sky filled with colors».
2. При желании Mochi 1 может сгенерировать промт за вас.
3. Для генерации жмем кнопку Generate.
4. Ждем 1-2 минуты, пока сгенерируется видео.
5. Готовым видео можно поделиться, либо скачать его.
В сгенерированном видео не все идеально с детализацией, но в остальном получилось реалистично.
Генерация видео по запросу с произвольными параметрами
1. Пишем промт: «The camera follows a powerful lion as it strides confidently through golden grass, its mane blowing gently in the breeze. The sunset behind casts a warm, glowing light, highlighting the lion’s features and creating a sense of quiet strength and beauty in the wild».
2. Нажимаем на кнопку настроек.
3. Выбираем модель Legacy.
4. Меняем пропорции с Auto.
5. Кликаем на Square.
6. Нажимаем кнопку библиотеки пресетов.
7. Выбираем стиль Warble.
8. Выбираем Generate.
9. Ждем, когда сгенерируется видео и скачиваем его.
Готовое видео продолжительностью 4 сек выглядит эффектно и натурально.
Видео с мультипликационным персонажем
1. Пишем промт: «A girl, blonde, in a blue dress, turns around, onto a field of flowers. The camera takes a close-up of the girl’s face. The girl looks into the frame».
2. Вызываем окно настроек.
3. Выбираем модель Legacy.
4. Соотношение сторон оставляем Auto.
5. Включаем параметр Loop, чтобы закольцевать видео.
6. Настраиваем параметры Camera motion.
7. Выставляем Zoom, Roll, Pan, Tilt. как на скрине.
8. Заходим в пресеты.
9. Выбираем Star Spin.
10. Запускаем генерацию и скачиваем готовое видео.
Получился маленький анимационный ролик. Когда Mochi 1 сможет генерировать фрагменты по 10 секунд, можно будет делать мультфильм за несколько часов.
Создание видео из фотографии
1. Пишем промт: «The girl looks at the camera and smiles».
2. Загружаем фотографию ребенка с компьютера.
3. Нажимаем на кнопку Settings.
4. Выбираем модель Legacy.
5. Выставляем пропорции кадра Auto.
6. Кликаем на «Продолжительность 6 сек».
7. Заходим в пресеты.
8. Выбираем: Whirl Glow.
9. Нажимаем Generate и ждем, пока сгенерируется видео.
Мы создали короткое видео по фотографии. У нейросетей при генерации видео с людьми в кадре часто бывают проблемы с пальцами, зубами, глазами. Обращайте на это внимание.
Для бесплатной версии Mochi 1 создает впечатляющие ролики. Движения в видео плавные, похожие на естественные. К сожалению, нейросеть часто генерирует лишние артефакты, которые портят впечатления.
Как оптимизировать работу с нейросетями
Максимально раскрыть возможности Mochi 1 можно, если развернуть модель на локальном компьютере. Но для эффективной работы необходима мощная аппаратная часть, которая есть не у всех. Оптимальным решением для работы с нейросетями может быть сервис JDAI Hub – удобный агрегатор нейросетей. Здесь вы найдете инструменты для создания разного контента, сможете сравнить их возможности и выбрать оптимальный вариант для ваших задач.