11 Марта 2024 | 16:46
Huawei создал конкурента Midjourney для генерации изображений в 4К
Бренд сравнил качество нейросети PixArt-Σ с ИИ-моделями других компаний
Компания Huawei представила новую нейросеть PixArt-Σ, которая основана на
более ранних технологиях PixArt-α (Alpha) и PixArt-δ (Delta),
сообщают разработчики.
Главное отличие PixArt-Σ от других инструментов — высокое разрешение
изображений. Нейросеть может генерировать картинки размером до 3840 x 2560
пикселей без промежуточного масштабирования даже в необычных соотношениях
сторон. Предыдущие модели PixArt были ограничены размером 1024 x 1024
пикселя.
Как сообщают разработчики, для того чтобы снизить вычислительные затраты,
они использовали стратегию «от слабого к сильному». Путем настройки модели от
более простых этапов к более сложным достигается высокая эффективность без
ущерба для качества. Этот подход в сочетании с более мощным автокодировщиком
переменных и сжатием токенов сокращает время обработки на 34%.
Компания Huawei продемонстрировала возможности PixArt-Σ, сравнив ее с
другими нейросетями.
Промт: 3D-анимация маленького круглого пушистого существа с большими
выразительными глазами, который исследует яркий заколдованный лес. Существо,
представляющее собой причудливую смесь кролика и белки с мягким голубым мехом и
густым полосатым хвостом. Он прыгает по сверкающему ручью, его глаза широко
раскрыты от удивления. Цветы, которые светятся и меняют цвет, деревья с
листьями фиолетовых и серебристых оттенков, а также маленькие плавающие
огоньки, напоминающие светлячков. Существо останавливается, чтобы игриво
пообщаться с группой крошечных сказочных существ, танцующих вокруг грибного
кольца.
Промт: очень крупный план седовласого мужчины с бородой лет 60. Он глубоко
задумался, размышляя над историей Вселенной. Он сидит в кафе в Париже, его
глаза сосредоточены на людях за кадром, когда они идут. Он сидит почти
неподвижно и одет в шерстяное пальто, рубашку на пуговицах. Он носит коричневый
берет и очки и имеет очень профессорский вид.
Другие сгенерированные PixArt-Σ изображения:
Промт: фотографии моделей крупным планом, туманный свет и тень, аксессуары
для волос из лазерного металла, мягкие и красивые, светло-золотые зрачки, белые
ресницы, низкая насыщенность, реальные детали кожи, четкие поры и тонкие линии,
отражение и преломление света, сверхчеткость, кинематография, отмеченные
наградами работы.
Промт: современный роскошный интерьер современного роскошного дома,
имитирующий разрушенные материалы, трассировку лучей, дома с привидениями и
камень, передает суть природы, серых и бронзовых, динамичных снимков на
открытом воздухе.
Промт: снимок в полный рост, француженка, фотография, фон французских улиц,
подсветка, контурный свет, Fujifilm.
Промт: автомобиль из овощей.
Промт: модель Lego, ракетная станция будущего, сложные детали, высокое
разрешение, нереальный двигатель, UHD.
Ранее OpenAI
выпустил нейросеть Sora для преобразования текста в видео.
Технология позволяет создавать сложные сцены с несколькими персонажами и точной
детализацией, сохраняя при этом визуальное качество и следование подсказкам
пользователя.
Источник: Источник
No comment