OpenAI представила нейросеть, способную скопировать голос по 15-секундной записи
Пока она доступна только отдельным тестировщикам
Пока она доступна только отдельным тестировщикам
Компания OpenAI, также известная как разработчик нейросети ChatGPT, представила платформу преобразования текста в голос Voice Engine. Она способна клонировать синтетический голос на основе 15-секундной записи реального голоса человека. Затем его можно использовать для озвучивания.
Первые примеры использования сервиса появились в блоге компании на этой неделе. Они показывают, что Voice Engine можно использовать, например, для автоматизированного перевода видео и аудио с сохранением голоса автора, а также создания нового контента почти без участия человека.
Уже сейчас Voice Engine используется для функции «Прочитать вслух» в ChatGPT. Отмечается, что нейросеть обучили на «сочетании лицензированных и открытых данных». Когда модель станет общедоступной, и будет ли за неё взиматься плата, пока публично не раскрывается.