Новый Взгляд на Управление Камерой с TrajectoryCrafter от Tencent

🚀 TrajectoryCrafter (Moving-Camera Diffusion) — это революционный инструмент, разработанный компанией Tencent, который открывает новые горизонты в области перенаправления траекторий камеры в монохромных видео. В этом посте мы подробно рассмотрим, как работает данная модель, а также её преимущества и уникальные особенности.

Как работает модель?

🌟 Инициализация

Начальный этап работы с TrajectoryCrafter начинается с траектории движения камеры, которая может быть как существующей, так и запущенной с чистого листа. Это начальное состояние становится основой, с которой модель будет работать, постепенно её совершенствуя. Что интересно, модель опирается на два типа входных данных: рендеры точечных облаков, которые представляют сцены в трехмерном формате, и исходные видео, что в значительной степени повышает её гибкость и адаптивность.

Диффузионный процесс

Процесс диффузии в данной модели представляет собой итеративную работу, в ходе которой происходит «очищение» случайного шума. Шаг за шагом модель трансформирует шумовые данные в последовательность динамичных и реалистичных траекторий. Ключевым аспектом здесь является предсказание модели о том, как должна выглядеть более плавная и согласованная траектория движения камеры, основанная на заданных условиях — будь то плавность или согласованность сцены.

Уникальный подход к обучению

В отличие от традиционных методов, которые опираются исключительно на видео, снятые под разными углами, разработчики TrajectoryCrafter применили инновационную стратегию — «двойную репроекцию». Суть этой стратегии заключается в комбинации как обширных монокулярных видео (полученных с обычной камеры), так и ограниченных, но высококачественных многоплановых видео. Такой подход значительно улучшает адаптацию модели ко всем возможным сценам.

Генерация итоговой траектории

После выполнения серии итераций, в которых происходит очистка шума, модель генерирует новую траекторию камеры. Эта траектория не только соответствует заданным условиям, но и обладает высоким уровнем визуальной динамики, что позволяет создавать поистине уникальные видеорядов. В конечном итоге результат превзошел ожидания и стал наглядным примером том, как современные технологии могут влиять на мир видеопроизводства.

Установка инструмента

Для тех, кто хочет попробовать данный инструмент в действии, установка осуществляется с помощью таких команд:

git clone --recursive https://github.com/TrajectoryCrafter/TrajectoryCrafter.git cd TrajectoryCrafter

Полезные ссылки

Если вас заинтересовало данное решение, вы можете ознакомиться с ним более подробно через следующие ссылки:

Эта модель открывает новые возможности для видеоиндустрии, от создания анимационной графики до применения в кино – её потенциал неограничен. Разработка таких инструментов свидетельствует о том, что мы находимся на пороге значительного прогресса в области компьютерного зрения и графики. Не упустите шанс стать частью этой удивительной эры технологий!

#opensource #ml #ai #cameracontrol #tencent


Новый инструмент от Tencent для перенаправления траекторий камеры в видео ver 0
Скачать


Обсуждение (0)

Войдите, чтобы оставить комментарий

Пока нет комментариев!



Вам также может понравиться

Интуитивная физика – это как здоровый глупец, который смотрит за игрой в шары и думает, что всё понимает. JEPA, как умный детектив, помогает искусственному интеллекту раскрывать секреты физики, анализируя миллионы видео. Исследование показывает, что через самообучение на реальных кадрах AI начинает понимать законы движения и взаимо... Читать далее