谷歌展示了生成人工智能(AI)领域的许多新进展,特别是在文本转视频和语言分析以及写作辅助方面。这些都是在11月2日星期三的谷歌AI活动上宣布的,VentureBeat报道。
会议还集中讨论了该公司创造道德AI的努力,重点关注控制和安全等问题,帮助识别生成式AI。
谷歌首席执行官桑达尔·皮采在向来宾展示的一段视频中表示,该公司致力于确保这项技术的设计是为了帮助人们,就像任何革命性的技术一样。万博体育登录首页这次活动的目的是重新想象技术如何对人们的生活有用。万博体育登录首页
读也:谷歌秘密以1亿美元收购推特支持的人工智能头像初创公司“Alter”
“Imagen Video & Phenaki”组合
谷歌Research的首席科学家、谷歌大脑团队的研究总监道格拉斯·埃克(Douglas Eck)公布了有关谷歌的生成人工智能的几项公告。其中包括谷歌在发布其文本-图像AI系统方面的谨慎而缓慢的努力,与DALL-E 2或Stability AI相比。
谷歌声明它将添加一个限制版本谷歌画像到其人工智能测试厨房应用程序来收集早期输入,尽管它还没有对公众开放。
此外,谷歌发布了第一个使用Imagen video和Phenaki文本到视频研究方法制作的视频,扩展了上个月发布的工作。最终结果是Phenaki基于文本的视频生成和Imagen的清晰视觉效果的混合。
文字作家工作坊
Eck还谈到了LaMDA对话引擎,以及它是如何在Wordcraft Writers Workshop中使用的,该Workshop要求知名作家创作实验性叙事。
根据边缘谷歌现在聘请LaMDA开发Wordcraft,这是一个原型写作工具,可以帮助有创意的作者创作原创小说作品。
自动写作辅助并不是什么新鲜事,比如Grammarly和Jasper。然而,文字技巧却与众不同,因为它是用来创作故事的。这是一个基于网络的文字处理器,Eck将其定义为“有目的的文本编辑器”。
该工具允许用户修改单词或给出特定指示,使语句更幽默。如果有提示,它还可能提供项目描述或建议。这是一个人工智能程序,既可以充当编辑,也可以充当写作伙伴。
人工智能驱动的语言模型
据报道,谷歌计划创建一个单一的人工智能语言模型,支持全球1000种最常用的语言。
根据一份单独的报告,该公司正在推出“目前语音模型中最大的语言覆盖率”,这是一个训练了400多种语言的人工智能模型边缘.
尽管面临着关于系统实用性的批评,谷歌已经开始将语言模型整合到谷歌搜索等产品中。语言模型经常重复不受欢迎的文化偏见,如种族主义和仇外心理,不能敏感地分析语言。谷歌以解雇在这些问题上发表论文的研究人员而臭名昭著。
相关故事:Shutterstock将使用OpenAI提供人工智能生成的库存图像
本文归科技时报所有万博体育登录首页
特丽莎·凯·安德拉达编剧