Новость

OpenAI создала нейросеть, копирующую голос человека с 15-секундного отрывка

Компания OpenAI, создавшая нейросети ChatGPT и Sora, представила новую программу, которая может генерировать по модели «текст в речь». Информация о технологии появилась на официальном сайте разработчиков.

Voice Engine может синтезировать голос носителя — для этого нейросети достаточно проанализировать небольшой отрывок продолжительностью 15 секунд. По задумке OpenAI, технология может использоваться для помощи людям с проблемами речи или чтения, при переводе аудио- и видеофайлов, а также при реабилитации некоторых типов больных.

Первые тесты программы стартовали еще в конце 2022 года, однако когда технология станет доступна на массовом рынке, неизвестно. Представители OpenAI заявили, что намерены сначала договориться с крупными компаниями и другими организациями, чтобы уменьшить негативный эффект от потенциального релиза ИИ, а также предотвратить использование технологии для мошенничества.