16 Февраля 2024 | 14:37
Новая нейросеть от OpenAI Sora превратит изображения и текст в видео
Нейросеть преобразует текстовые задания в видеоролики. На форуме разработчиков OpenAI уже начались разговоры о риске потери работы моушен-дизайнеров
OpenAI представила нейросеть Sora для преобразования текста в видео. С ее
помощью можно генерировать ролики длительностью до минуты, сообщается на
сайте компании.
ИИ-модель способна создавать сложные сцены с несколькими персонажами и
точной детализацией, сохраняя при этом визуальное качество и следование
подсказкам пользователя, говорится в описании Sora. Также нейросеть умеет
генерировать видео на основе статичного изображения, добавляя недостающие
кадры.
В одной из веток
форума разработчиков OpenAI сегодня началось обсуждение
возможностей Sora. Один из пользователей, представившийся как моушен-дизайнер,
американской анимационной студии Laika, выразил опасение, что Sora может лишить
работы «огромное количество людей, работающих в кино и анимации».
«Как профессиональный аниматор, я поражен возможностями, которые
демонстрирует Sora. Я заинтригован и одновременно напуган. Долгое время
аниматоры покадровой анимации боялись, что на нашу работу придут CG-аниматоры.
Вместо этого теперь кажется, что ИИ придет за их работой, а потом и займет
места всех моушен-дизайнеров. Я заинтересован в том, чтобы поделиться своим
уникальным взглядом на OpenAI, насколько это возможно. Я также хочу
предупредить OpenAI, что у Sora действительно есть потенциал, который может
лишить работы огромное количество людей, работающих в кино и анимации», —
говорится в комментарии.
Пока Sora находится на этапе тестирования. Доступ к ней открыт ограниченному
количеству пользователей: дизайнерам, художникам, кинорежиссерам — для
получения обратной связи и доработки ИИ.
Создатели технологии также предупредили, что у нейросети все еще есть слабые
стороны, среди которых — отсутствие причинно-следственных связей. Например, в
одном из сгенерированных роликов женщина задувает свечи на торте, но они не
потухают.
Сгенерированные Sora ролики
Промт: камера направлена прямо на красочные здания в Бурано, Италия.
Очаровательный далматинец смотрит в окно здания на первом этаже. Множество
людей прогуливаются пешком или на велосипеде по улицам канала перед
зданиями.
Промт: стильная женщина идет по улице Токио, наполненной теплым светящимся
неоном. Она носит черную кожаную куртку, длинное красное платье и черные
сапоги, а также черную сумочку.
Промт: исторические кадры Калифорнии во времена золотой лихорадки.
Разработчики OpenAI создают классификатор обнаружения, с помощью которого
можно определить, когда видео сгенерировано Sora. В том числе планируется
использовать метаданные C2PA для определения происхождения ролика.
Ранее на этой неделе OpenAI
объявила
о тестировании функции ChatGPT — возможности запоминать информацию о
взаимодействии с пользователем с прошлого момента использования. До этого в ИИ
использовалась контекстная память, которая сохранялась только на протяжении
одного разговора.
Источник: Источник
No comment