谷歌在其DeepMind人工智能(ai)项目中取得了里程碑式的进展,成功开发出了可以模仿人类声音的技术。万博体育登录首页

这一突破被称为WaveNet,被描述为一种深度神经网络,可以生成原始音频波形来生成语音。据报道,它可以击败现有的文本转语音系统。

据英国WaveNet部门的研究人员称,在实际的人工智能(人类对话)中,人类表现的差距减少了50%。

WaveNet技术的另一个有趣之处在于,它能够学习不同的声音和说话模式,除了情绪、语言万博体育登录首页变化和口音之外,它甚至可以模拟嘴巴的动作和人工呼吸。

研究人员说:“单个WaveNet可以以同样的保真度捕捉许多不同说话者的特征,并可以通过调节说话者的身份在它们之间切换。写了在一篇论文中。

WaveNet目前可以使用英语和中文。它还可以制作古典钢琴曲等音乐,并自己创作歌曲。

谷歌最近的人工智能突破的意义在于实现其当前技术质量所需的大量数据。万博体育登录首页为了更好地理解这一点,我们应该考虑一下大多数计算机生成的文本到语音技术是如何基于收集大量的人类声音记录的。万博体育登录首页

谷歌正在使用人工智能来应对这一挑战,基于先前的PixelRNN和PixelCNN或二维Pixelnets技术,选择了一种称为原始音频建模的方法。万博体育登录首页新系统被描述为一维的WaveNet,每秒至少需要16,000个不同的样本位,这需要使用WaveNet的创造者巨大的计算能力在一篇博客文章中。该系统必须经过训练来产生话语和学习上下文等等。WaveNet算法总共需要100多个扬声器录制44小时的样本声音。

目前,观察人士认为,与DeepMind算法相比,WaveNet没有任何直接的商业用途,而DeepMind算法可以降低能源消耗万博体育登录首页科技时代

然而,随着人们越来越依赖科技,就需要复杂而自然的机制来确保与人类有效而无缝的互动。万博体育登录首页正因如此,WaveNet受到了科技公司的密切关注,万博体育登录首页根据布隆伯格。

图片:一个健康博客|Flickr

corber2万博体育登录首页022 TECHTIMES.com未经允许,请勿转载。