11 Марта 2024 | 16:46

Huawei создал конкурента Midjourney для генерации изображений в 4К

Бренд сравнил качество нейросети PixArt-Σ с ИИ-моделями других компаний

Компания Huawei представила новую нейросеть PixArt-Σ, которая основана на
более ранних технологиях PixArt-α (Alpha) и PixArt-δ (Delta),
сообщают разработчики.

Главное отличие PixArt-Σ от других инструментов — высокое разрешение
изображений. Нейросеть может генерировать картинки размером до 3840 x 2560
пикселей без промежуточного масштабирования даже в необычных соотношениях
сторон. Предыдущие модели PixArt были ограничены размером 1024 x 1024
пикселя.

Как сообщают разработчики, для того чтобы снизить вычислительные затраты,
они использовали стратегию «от слабого к сильному». Путем настройки модели от
более простых этапов к более сложным достигается высокая эффективность без
ущерба для качества. Этот подход в сочетании с более мощным автокодировщиком
переменных и сжатием токенов сокращает время обработки на 34%.

Компания Huawei продемонстрировала возможности PixArt-Σ, сравнив ее с
другими нейросетями. 

Промт: 3D-анимация маленького круглого пушистого существа с большими
выразительными глазами, который исследует яркий заколдованный лес. Существо,
представляющее собой причудливую смесь кролика и белки с мягким голубым мехом и
густым полосатым хвостом. Он прыгает по сверкающему ручью, его глаза широко
раскрыты от удивления. Цветы, которые светятся и меняют цвет, деревья с
листьями фиолетовых и серебристых оттенков, а также маленькие плавающие
огоньки, напоминающие светлячков. Существо останавливается, чтобы игриво
пообщаться с группой крошечных сказочных существ, танцующих вокруг грибного
кольца. 

Промт: очень крупный план седовласого мужчины с бородой лет 60. Он глубоко
задумался, размышляя над историей Вселенной. Он сидит в кафе в Париже, его
глаза сосредоточены на людях за кадром, когда они идут. Он сидит почти
неподвижно и одет в шерстяное пальто, рубашку на пуговицах. Он носит коричневый
берет и очки и имеет очень профессорский вид.

Другие сгенерированные PixArt-Σ изображения:

Промт: фотографии моделей крупным планом, туманный свет и тень, аксессуары
для волос из лазерного металла, мягкие и красивые, светло-золотые зрачки, белые
ресницы, низкая насыщенность, реальные детали кожи, четкие поры и тонкие линии,
отражение и преломление света, сверхчеткость, кинематография, отмеченные
наградами работы.

Промт: современный роскошный интерьер современного роскошного дома,
имитирующий разрушенные материалы, трассировку лучей, дома с привидениями и
камень, передает суть природы, серых и бронзовых, динамичных снимков на
открытом воздухе.

Промт: снимок в полный рост, француженка, фотография, фон французских улиц,
подсветка, контурный свет, Fujifilm. 

Промт: автомобиль из овощей.

Промт: модель Lego, ракетная станция будущего, сложные детали, высокое
разрешение, нереальный двигатель, UHD.

Ранее OpenAI
выпустил нейросеть Sora для преобразования текста в видео.
Технология позволяет создавать сложные сцены с несколькими персонажами и точной
детализацией, сохраняя при этом визуальное качество и следование подсказкам
пользователя.

Источник: Источник

No comment

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *