OpenAI在其最新发展方面迈出了重大的步伐,text-to-3D对象系统称为Shap-E AI,首次报道了吗新的地图集

这个生成人工智能工具可用于开放源码下载,它可以生成3 d资产直接从使用提供的图片文字描述甚至构建它们。

Software-internet-US-INTERNET-SOFTWARE-AI-OPENAI
(照片:斯蒂芬妮雷诺/法新社通过盖蒂图片社)
这张照片说明显示了ChatGPT标志在一个办公室在华盛顿,华盛顿,2023年3月15日。ChatGPT应用背后的公司,培养出散文,诗歌,或计算代码命令发布3月14日,2023年,一个期待已久的人工智能(AI)技术的更新,它说会比其前任更安全、更准确。万博体育登录首页

“隐函数”

前一版本称为点e, OpenAI介绍一个系统能够将文本提示转换为基本形式的3 d模型点云。

然而,新的Shap-E系统代表了重大的飞跃,它不仅速度快,而且能够建立模型作为“隐函数”。

这些函数是数学公式,可以呈现为变形网格或神经光辉字段(削弱),这是3 d模型通过机器学习从2 d图像生成。

虽然看起来复杂,技术万博体育登录首页方面潜在的应用程序是真正迷人的。这些3 d模型是专门设计为符合下游应用程序,导致令人兴奋的可能性。

这种技术可万博体育登录首页以代表提前一步verbally-programmed 3 d视觉效果,提供潜在的产生从虚拟服装个性化的家庭甚至虚拟的同伴在VR /基于“增大化现实”技术的应用。

Shap-E的功能系统的进步,它将接口无缝3 d打印技术。这意味着这些AI系统创建的形状可能很快成为有形的物体在现实世界中,产生更高的质量。

在未来,用户可能没有直接与系统本身,而是与语言基于模型的智能通信助理将生成适当的提示3 d-maker AI,导致更有效和准确的输出。

读也:元的AI沙箱是广告商的生成AI现在可供用户来测试新的工具

有条件的生成模型

OpenAI介绍Shap-E作为革命条件生成3 d模型的资产。与之前的3 d生成模型,产生一个输出表示,Shap-E直接生成隐函数的参数,可以呈现为变形网格和神经光辉字段。

训练过程包括两个阶段:首先,一个编码器训练3 d资产映射到隐式函数的参数;其次,一个条件扩散模型训练使用编码器的输出。

培训一个巨大的数据集的配对3 d和文本数据,生成的模型表现出的能力生成复杂而多样的3 d资产在几秒钟内。

点e相比,显式生成模型点云,Shap-E演示了更快的收敛和达到甚至比样品质量尽管建模一个高维multi-representation输出空间,所述研究人员在新系统。

OpenAI使得模型权重,推理代码,和样品提供给公众,使进一步的探索和创新。它是可用的在这里

相关文章:微软引入Bing聊天,比人工智能文本生成特性,可用于打开预览

署名
ⓒ2023 T万博体育登录首页ECHTIMES.com保留所有权利。不复制未经许可。