Нейросети и ИИ👁 2

Netflix открыла модель для удаления объектов из видео

Netflix открыла нейросеть VOID для удаления объектов из видео с учетом физики и движения камеры. Исходный код доступен на GitHub.

NF

Редакция NeuralFeed

Команда авторов — следим за миром ИИ и нейросетей

Netflix открыла модель для удаления объектов из видео — 1 из 2
1 / 2

Корпорация Netflix, известная прежде всего как стриминговый гигант, сделала неожиданный шаг в мире искусственного интеллекта. Компания выложила в открытый доступ свою собственную нейросеть под названием VOID. Эта модель специализируется на сложной задаче — удалении объектов из видеопотока с последующим реалистичным дорисовыванием фона.

Как работает технология удаления объектов

Традиционные методы удаления объектов часто оставляют после себя артефакты или «дыры» в кадре, особенно если объект занимает значительную часть экрана. Модель VOID решает эту проблему, анализируя не только текущий кадр, но и контекст движения камеры. Пользователю достаточно указать на объект, который нужно стереть, и алгоритм самостоятельно определяет, как заполнить освободившееся пространство.

Главное преимущество этой технологии заключается в её способности понимать физическую логику мира. Если вы удалите человека, который держал кружку, нейросеть не оставит кружку парящей в воздухе. Вместо этого она корректно предсказывает гравитацию: кружка упадет на пол или стол, а её тень и отражение исчезнут вместе с объектом.

Технические возможности и применение

Модель демонстрирует впечатляющие результаты в обработке динамичных сцен. Она учитывает периферийное движение камеры, что позволяет сохранять целостность фона даже при панорамировании. Это открывает широкие перспективы для:

  • Кинематографа и постпродакшна: Упрощение процесса монтажа, удаление лишних актеров или предметов со съемочной площадки без необходимости переосвещения сцены.
  • Разработки видеоигр: Создание процедурных уровней, где объекты могут динамически исчезать или появляться, не нарушая физическую среду.
  • Обработки видеозвонков: Возможность автоматически размывать или удалять посторонние предметы в фоне видеоконференций для повышения конфиденциальности.

Открытый исходный код модели доступен на платформе GitHub, где разработчики Netflix предоставляют подробную документацию и примеры использования. Для тех, кто хочет сразу протестировать возможности нейросети без глубокого погружения в код, модель также размещена на Hugging Face. Это решение позволяет исследователям и энтузиастам оценить потенциал технологии в реальных задачах компьютерного зрения.

Выход модели VOID в открытый доступ подчеркивает растущую роль технологических гигантов в развитии общедоступных инструментов ИИ. Вместо того чтобы ограничивать свои разработки, Netflix делится знаниями, способствуя прогрессу в области обработки видео и компьютерного зрения для всего сообщества.

#нейросеть#искусственный интеллект#Netflix#удаление объектов#компьютерное зрение#видеообработка#компьютерный зрение#физика объектов#открытый исходный код

Комментарии

Пока нет комментариев. Будьте первым!

Оставить комментарий

0/2000