LDNews 消息, Meta公布其语音生成AI模型Voicebox。Voicebox支持从文本中生成语音,能够根据仅两秒长的样本匹配音频风格,并将文本样本转换为另一种语言;在给定单独的语音样本的情况下,并能够以说话者的原始语音朗读翻译后的文本内容。
Voicebox目前支持六种语言:英语、法语、德语、西班牙语、波兰语和葡萄牙语。Meta表示,在未来,像Voicebox这样的多用途生成AI模型可以让元宇宙中的非玩家角色和虚拟助手发出自然的声音,可以让视障人士听到AI用其声音朗读来自朋友的书面信息,为创作者提供新的工具来轻松创建和编辑视频的音轨等。 [原文链接]