OpenAI выпустила семейство моделей для создания голосовых помощников
Технология получила поддержку русского языка
Технология получила поддержку русского языка
Модели созданы на базе GPT-4o. С их помощью пользователи смогут преобразовать текст в аудио, транскрибировать аудиозаписи и распознавать речь в режиме реального времени. Всего модели поддерживают более 100 языков, в том числе и русский.
Для пользователей подготовили 11 голосов. С помощью текста им можно задать тон, эмоции и характер. Например, технология может говорить, как «безумный учёный».
В OpenAI уточнили, что новые модели заменят нейросеть Whisper. Согласно заявлению компании, они делают меньше ошибок в словах и лучше распознают речь в шумной обстановке. При этом организация не будет публиковать открытый исходный код моделей — доступ к ним откроется только для работы через API.
Воспользоваться новыми моделями смогут разработчики. Они также доступны в бесплатной демоверсии. Пользователи смогут ввести не более одной тысячи знаков.