SberDevices создала ИИ-модель для распознавания речи и эмоций

08 Апреля 2024 | 18:51

Команды разработки сервисов GigaChat и SaluteSpeech в SberDevices
представили нейросеть GigaAM (Giga Acoustic Model) —
семейство акустических моделей для русского языка, которые позволяют
распознавать речь и эмоции.

В семейство вошли три модели: GigaAM, GigaAM-CTC и GigaAM-Emo.

Технология GigaAM предобучена на разнообразной русской речи. Она может
подойти для адаптации под различные задачи работы со звуком, включая
распознавание речи и эмоций, определение диктора и другие. GigaAM-CTC —
открытая модель для распознавания русскоязычных запросов. А GigaAM-Emo —
акустическая модель для определения эмоций.

«Улучшенные версии этих моделей бизнесу доступны на нашей платформе для
синтеза и распознавания речи SaluteSpeech API, а физические лица также могут
ими воспользоваться в приложении SaluteSpeech App», — рассказали в
компании.

Ранее сообщалось, что SberDevices начала применять ИИ в рекламных
форматах Сервси внедряет нейросети в виджеты, смарт-баннеры и Out-Steam
Video.

Еще материалы

Анимационная студия из Воронежа разработала 3D-редактор для создания мультфильмов

Google начал бороться с кражей файлов cookie

«Яндекс Лавка» поможет бизнесу с нуля запустить сборку и доставку товаров

«Авито» выйдет на рынок онлайн-бронирования отелей

TikTok перестал быть прибыльным в России в 2023 году

OpenAI позволила менять выражение лица на сгенерированных картинках

Источник: Источник

Usovpro

08.04.2024

Новости

No comment

Добавить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

PreviousАнимационная студия из Воронежа разработала 3D-редактор для создания мультфильмов

NextOzon почти догнал VK по рекламной выручке

Related Posts ...

Маск ответил «всегда рад» на просьбу по Starlink министра обороны

Аналитики оценили готовность россиян доверить выбор покупок ИИ

Эмма Стоун в слезах и ставки Кендалл Дженнер: что покажут на Super

No comment

Добавить комментарий Отменить ответ