谷歌是展示一个新的翻译工具,甚至比其更加动态的和强大的翻译软件。工具,称为Translatotron,转换语音直接和啐在用户的自己的声音,引导。

Translatotron首开先河的翻译模型,可以直接将语音转化为另一种语言,而不是将语音转换成文本然后转换回演讲。通常,演讲翻译使用自动语音识别将语音转换成文本,然后使用语音合成软件生成一个翻译。但在这个新模型中,可能会有更少的错误翻译。谷歌希望这个端到端技术将打开未来的发展将语音转换万博体育登录首页为另一种语言。

谷歌Translatotron

随着谷歌解释了Translatotron利用sequence-to-sequence网络模型,语音输入,处理谱图,并创建一个新的谱图在目标语言。因此,翻译要快得多,也不太可能港错误。因为工具与谱图,可以使用一个可选的发言人编码器,相似的声音。这意味着Translatotron翻译演讲不仅可以直接从一种语言到另一个,它还可以匹配用户的节奏、音高和其他方面,使他们的声音独特。

如Engadget笔记模仿并不完美。由此产生的声音听起来仍然机器人,但它保持的一些元素扬声器的声音。谷歌研究的GitHub上有音频样本页面。它并不总是做得正确,当然。但对于任何创新,这是完善之前它会需要一些时间。在任何情况下,这是一个开始。

”我们所知,Translatotron是第一个端到端的模型可以直接讲话从一种语言翻译成另一种语言的演讲,“谷歌在其博客中写道。“还能保留源的讲话者讲话声音的翻译。”

蓝色的分数

来评估其效率和翻译质量,谷歌使用蓝色题目的测量。虽然结果落后传统翻译系统,谷歌表示,它已经证明了端到端直接翻译“从语音到语音”的可行性。更重要的是,Translatotron比基线级联实现更准确的翻译翻译。

细节Translatotron工具在讲话中详细介绍被称为“直接“从语音到语音”的翻译sequence-to-sequence模型。”The tool comes a month after Google introduced SpecAugment, an artificial intelligence model that combines computer vision and a bevy of techniques to glean words from spectrogram imagery.

ⓒ2023 T万博体育登录首页ECHTIMES.com保留所有权利。不复制未经许可。