08 Апреля 2024 | 18:51

SberDevices создала ИИ-модель для распознавания речи и эмоций

Команды разработки сервисов GigaChat и SaluteSpeech в SberDevices
представили нейросеть GigaAM (Giga Acoustic Model) —
семейство акустических моделей для русского языка, которые позволяют
распознавать речь и эмоции.

В семейство вошли три модели: GigaAM, GigaAM-CTC и GigaAM-Emo.

Технология GigaAM предобучена на разнообразной русской речи. Она может
подойти для адаптации под различные задачи работы со звуком, включая
распознавание речи и эмоций, определение диктора и другие. GigaAM-CTC —
открытая модель для распознавания русскоязычных запросов. А GigaAM-Emo —
акустическая модель для определения эмоций. 

«Улучшенные версии этих моделей бизнесу доступны на нашей платформе для
синтеза и распознавания речи SaluteSpeech API, а физические лица также могут
ими воспользоваться в приложении SaluteSpeech App», — рассказали в
компании. 

Ранее сообщалось, что SberDevices начала применять ИИ в рекламных
форматах Сервси внедряет нейросети в виджеты, смарт-баннеры и Out-Steam
Video.

Еще материалы

Анимационная студия из Воронежа разработала 3D-редактор для создания мультфильмов

Google начал бороться с кражей файлов cookie

«Яндекс Лавка» поможет бизнесу с нуля запустить сборку и доставку товаров

«Авито» выйдет на рынок онлайн-бронирования отелей

TikTok перестал быть прибыльным в России в 2023 году

OpenAI позволила менять выражение лица на сгенерированных картинках

Источник: Источник

No comment

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *