他们听每一个字。这是最常见的恐惧与设备相关的麦克风,和一个巨大的推动增加公司如何处理收集的数据审查他们的智能产品。
现在,亚马逊是一个潜在的巨大的数据中心的丑闻表明工人,不仅人工智能,是听Alexa语音命令。
亚马逊一直是诚实的,它的数字助理是一个正在进行的工作。在Alexa的FAQ页面,亚马逊使用数据来训练这些系统,和它使用的越多,Alexa的作品越好。更重要的是,培训Alexa录音从范围广泛的客户“有助于确保Alexa适用于每个人。”
亚马逊是听你的声音命令
但深入调查进行了彭博社(Bloomberg)显示,亚马逊完善Alexa的方法之一是通过实际人类听真实的声音录音。这个过程称为数据注释和边缘指出,它默默地成为最近的核心元素之一机器学习革命也孕育了巨大的改进在自然语言处理、翻译、图像和对象识别。
监督式学习
这个想法是AI算法只能改善随着时间的推移,如果他们得到的数据可以很容易地解析和分类组织。他们不够强大或智能解释数据。当一个亚马逊回声语音命令,Alexa并不总是准确听到它。这是亚马逊工人进来。他们倾听交流,标签数据正确,并喂它回系统“教”。这种方法“监督式学习”并不是在所有新苹果,Facebook和谷歌使用它来改善各自的服务。
但在亚马逊的案例中,布隆伯格揭示了文字成千上万的世界各地的亚马逊员工负责听Alexa录音。然而,更多的问题是大多数用户并不知道这是发生。更糟的是,一些记录可能包含可识别信息的人来说,这可能是滥用数据的路径。
回应彭博社的报道,亚马逊表示,它只注释“极其小样本”的声音录音“改善客户体验。”
“[T]他的信息帮助我们训练我们的语音识别和自然语言理解系统,所以Alexa可以更好地理解你的要求,并确保服务适用于每个人。”亚马逊added that it employs "strict technical and operational safeguards" and that it imposes "zero tolerance policy for the abuse of our system."
此外,它说员工没有身份的人来说,任何信息,可能是录音中处理高机密性。
根据亚马逊,回声设备不存储音频,除非它检测到一个唤醒词或按下一个按钮被激活。然而,Alexa有时甚至当它记录的东西不触发或提示。是否记录的目的是,彭博社报道,誊写仍需要解析它。一名消息人士表示,审计人员每个抄写多达100录音每天当Alexa收到没有唤醒词或由事故引起。