三星正在发布一项新的语音克隆功能,拥有 Galaxy 智能手机的用户可以使用该功能创建人工智能生成的语音版本以接听电话。

三星Galaxy S23这项新功能可创建人工智能版本的语音来接听电话

该功能作为“文本呼叫”功能的 AI 增强功能出现在 Bixby 智能手机助手中,该功能允许用户在无法使用语音接听电话时键入响应。此响应由 Bixby 转换为音频,然后响应呼叫者。但 Bixby 的“自定义语音创建器”选项不是使用 Bixby 语音,而是让用户用自己的语音录制句子。然后,Bixby 会以用户的语音和音调创建 AI 生成的消息副本。

三星解释说:“使用新的 Bixby Custom Voice Creator,用户可以为 Bixby 录制不同的句子,以分析和创建 AI 生成的语音和音调副本。”

三星现在正在向英语市场推出 Bixby 文本通话,而自定义语音生成器目前仅提供韩语版本。

语音克隆功能目前仅限于三星手机应用程序的通话,但三星计划将其用于其他三星应用程序。

Bixby 文本通话可在 Galaxy S23、S23+、S23 Ultra、Z Fold 4 和 Z Flip 4 上使用,One UI 5.1 或更高版本适用于英语。语音创建器功能适用于 Galaxy S23、S23+ 和 S23 Ultra。

人工智能生成的语音是大型科技公司越来越感兴趣的领域。亚马逊最近决定展示 Alexa 的语音生成能力,有点笨拙,展示它用孩子已故祖母的声音朗读儿童故事。“虽然人工智能不能消除失去的痛苦,但它绝对可以让他们的记忆持久,”一位亚马逊高管说。

人们担心 AI 生成的语音技术如何被用于 为错误信息活动或语音网络钓鱼创建 deepfakes。联邦调查局去年警告说,它发现在在线面试中使用语音深度伪造的欺诈性求职者数量有所增加。

OpenAI 公开发布 ChatGPT 的决定似乎为其他人打开了发布生成 AI 功能或产品的闸门,最著名的是微软通过 Bing Chat 和谷歌在Google Bard,以及每家公司都向第三方开发人员提供的 API 。

我尝试了Resemble.AI基于 GPT-3 的语音合成生成器。它需要一段 30 秒的录音样本,让我重复该网站的录音使用条款。该样本被上传到其服务器并在大约一分钟内合成。然后我输入了一个简短的句子,它以我的语调清晰清晰且相当接近的副本重播,但以强烈的北美口音说话,这与我温和的澳大利亚口音截然不同。

另外,在将其设备上的 AI 与三星应用程序集成后,三星还表示即将对基于 AI 的语音听写进行改进。这一举措听起来像是三星正在研究谷歌语音听写功能的答案,该功能仅在使用 Google Assistant 的 Pixel 6 和 7 设备上可用。