使用 OPENAI 语音引擎体验更高水平的文本转语音
OpenAI 是一家领先的人工智能研究实验室,推出了 Voice Engine,这是一个革命性的文本转语音 (TTS) 平台,可利用仅 15 秒的音频样本来生成人声的合成副本。这项创新技术是继 OpenAI 的文本到视频人工智能模型Sora于 2024 年初成功首次亮相之后推出的。进一步巩固了他们对突破创意人工智能应用界限的承诺。
功能和应用
语音引擎使用户能够生成能够阅读各种语言(包括说话者的母语)文本提示的合成语音。这为不同行业打开了大门,潜在的应用范围从教育工具到内容创建和通信无障碍。
然而,OpenAI 承认这种强大技术固有的滥用可能性。在积极探索其建设性应用的同时,他们强调对负责任的部署策略的承诺。
开发和早期实施
语音引擎的开发于 2022 年底开始,现已集成到 OpenAI 现有的 TTS 基础设施中,包括ChatGPT语音和朗读功能。通过合作伙伴关系和小规模部署,该公司收集了对该平台实际应用的宝贵见解。
此外,以下是各个领域的一些有前景的早期用例:
阅读辅助:学习时代利用语音引擎为儿童和非阅读者提供个性化的学习体验。该技术可为预先编写的画外音内容生成听起来自然、富有感情的声音,促进理解和参与。此外,它还允许实时交互,进一步增强学习过程。
免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。