微软的新人工智能可以轻松地复制人的声音。
(图片来源:CLEMENT MAHOUDEAU/AFP / Getty Images)
2022年7月14日,在阿维尼翁边缘艺术节上,乌拉圭开发者Tammara Leites的影子在人工智能(digital Simon)生成的文本前摆姿势。
这家科技万博体育登录首页巨头悄无声息地推出了新的人工智能。这项技术没有任何新闻发布会或其他重大公告。万博体育登录首页
但这不是问题所在。专家们对新型VALL-E模仿任何人声音的能力表示担忧。
如果你想知道为什么有些人对VALL-E的到来感到震惊,以下是人工智能的真正能力。
微软新人工智能VALL-E
根据ZDNet在最新的报告中,微软的VALL-E是一个新的TTS(文本到语音)系统。
(图片来源:JOHANNES EISELE/AFP / Getty Images)
2014年7月30日,微软Xbox One在上海发布会上的标志。中国官方媒体称,中国对微软的调查可能是针对其在中国操作系统市场的“垄断”,此前这家美国软件巨头成为最新一家受到北京审查的外国公司。
还读:由于ChatGPT的使用问题,英国教育工作者正在重新考虑课程评估
这家软件巨头表示,这是一种新的神经编解码器语言模型,使用来自神经音频编解码器的离散代码。
通过其Github演示页面,微软写道,新的人工智能可以模仿人的说话风格。
VALL-E可以通过听一段三秒钟的录音来做到这一点。
微软表示:“VALL-E具备情境学习能力,只需对一个看不见的说话者进行3秒的录音,就可以合成高质量的个性化语音。”
VALL-E的效率
微软对新的VALL-E TTS系统进行了6万小时的英语语音训练。
这家科技万博体育登录首页公司使用了Meta的LibriLight音频库,其中有超过7000个录音。
基于微软的样本,VALL-E可以有效地从LibriLight复制不同说话者的声音。
这家软件巨头提供了原始的三秒录音,并比较了VALL-E的版本。
令人惊讶的是,TTS技术可以复制发音和演讲者万博体育登录首页的演讲。大多数VALL-E的音频是如此相似,你不会注意到任何差异,从原来的。
这就是问题开始的地方。许多专家表示,如果诈骗者和其他网络犯罪分子能够创造出类似的技术,他们就可以轻松地复制受害者的声音。万博体育登录首页
想象一下接陌生人的电话。在那之后,你的声音已经被用于恶意活动。
如果您想了解更多关于为什么许多个人关注新的VALL-E,您可以点击在这里.
新的VALL-E并不是微软唯一忙于开发的技术。万博体育登录首页
最近,新的微软Surface Duo 3据报道,集成了可折叠显示屏。
我们也报道过微软的Windows 7安全启动已经推出。
有关VALL-E和其他新人工智能的更多新闻更新,请打开TechTimes的标签。万博体育登录首页
相关文章:由于担心作弊和错误信息,纽约学校禁止聊天