谷歌
(图片来源:Unsplash/ Paul Hanaoka

谷歌目前正在寻求帮助开发一款Android应用程序,旨在为有语言障碍的人提供更多的交流选择。

谷歌的项目相关

据介绍,这款应用名为Project Relate,旨在进行语音转录和合成,让用户更容易听懂万博体育登录首页TechCrunch

这款应用程序起源于2019年宣布的Euphonia项目。谷歌后来为Euphonia项目发表了一些研究成果。

这项工作是由谷歌的研究科学家迪米特里·卡内夫斯基领导的,他患有语言障碍。她为基于人工智能的解决方案带来了第一手的知识。

现在,Project Relate的主要合作伙伴和应用程序的用户之一是Aubrie Lee,她是营销团队的一员,她也有肌肉萎缩症导致的语言障碍,因此她很难被其他人和其他应用程序理解。

还读:谷歌地图为视障人士增加了详细的语音指导

事实上,语音识别引擎需要大量的录音语音来学习如何正确地解释它,而这些数据偏向于常见的语音模式瘾科技

那些口音重的人在这些数据集中没有表现出来,这意味着他们也不被理解。

由于不包括有语言障碍的人,所以他们很难使用常用的语音设备。

据介绍,许多开发这项技术的公司都在对该系统进行改进,以理解带有浓重口音的万博体育登录首页语言边缘

然而,为了收集和分析有言语障碍和其他残疾的人的个性化言语模式,需要不同类型的努力。

每个人的声音都是不同的,然而,机器学习系统很难可靠地理解由中风或受伤引起的不常见和独特的模式。

谷歌的语音转录

Project Relate对于有语言障碍的人来说是一种更好的语音转录工具。它有一个“听”选项,可以将用户的演讲转化为文本,这样它就可以发布在其他地方,也可以被其他人阅读。

“重复”选项先听语音,然后重复刚才说的更清楚的话。“助手”选项有助于将转录的语音转发到谷歌助手,以便用户可以执行常见任务,如询问某些主题或播放音乐。

为了激活这些功能,谷歌的工作首先是收集数据,为此,研究人员表示谷歌已经创建了一个由志愿者制作的100多万份语音样本的数据库。

这被用来训练语音识别人工智能的所谓基础智力水平。然而,就像任何其他ML系统一样,数据越多,数据对使用它的人就越具体,从而使它更有帮助。

该公司正在招募几名能够定期使用这款应用的真实测试人员。志愿者将被要求录制几个短语,这些短语将与谷歌的语音模型相结合,以适应系统的语音模式。

如果你认为这对你的日常生活有帮助,你可以注册成为一名潜在的志愿者,你可以帮助塑造每个人都可以使用的应用程序。

在2016年,谷歌为视觉、听觉和运动障碍用户推出了新工具。

9月,该公司还推出了一款Android应用程序,帮助那些有语言障碍和运动障碍的人。

相关文章:谷歌更新:Lookout的新功能将帮助盲人读出物体的标签和文档

本文归科技时报所有万博体育登录首页

作者:苏菲·韦伯斯特

corber2万博体育登录首页022 TECHTIMES.com未经允许,请勿转载。