OpenAI在其最新发展方面迈出了重大的步伐,text-to-3D对象系统称为Shap-E AI,首次报道了吗新的地图集。
这个生成人工智能工具可用于开放源码下载,它可以生成3 d资产直接从使用提供的图片文字描述甚至构建它们。
“隐函数”
前一版本称为点e, OpenAI介绍一个系统能够将文本提示转换为基本形式的3 d模型点云。
然而,新的Shap-E系统代表了重大的飞跃,它不仅速度快,而且能够建立模型作为“隐函数”。
这些函数是数学公式,可以呈现为变形网格或神经光辉字段(削弱),这是3 d模型通过机器学习从2 d图像生成。
虽然看起来复杂,技术万博体育登录首页方面潜在的应用程序是真正迷人的。这些3 d模型是专门设计为符合下游应用程序,导致令人兴奋的可能性。
这种技术可万博体育登录首页以代表提前一步verbally-programmed 3 d视觉效果,提供潜在的产生从虚拟服装个性化的家庭甚至虚拟的同伴在VR /基于“增大化现实”技术的应用。
Shap-E的功能系统的进步,它将接口无缝3 d打印技术。这意味着这些AI系统创建的形状可能很快成为有形的物体在现实世界中,产生更高的质量。
在未来,用户可能没有直接与系统本身,而是与语言基于模型的智能通信助理将生成适当的提示3 d-maker AI,导致更有效和准确的输出。
读也:元的AI沙箱是广告商的生成AI现在可供用户来测试新的工具
有条件的生成模型
OpenAI介绍Shap-E作为革命条件生成3 d模型的资产。与之前的3 d生成模型,产生一个输出表示,Shap-E直接生成隐函数的参数,可以呈现为变形网格和神经光辉字段。
训练过程包括两个阶段:首先,一个编码器训练3 d资产映射到隐式函数的参数;其次,一个条件扩散模型训练使用编码器的输出。
培训一个巨大的数据集的配对3 d和文本数据,生成的模型表现出的能力生成复杂而多样的3 d资产在几秒钟内。
点e相比,显式生成模型点云,Shap-E演示了更快的收敛和达到甚至比样品质量尽管建模一个高维multi-representation输出空间,所述研究人员在新系统。
OpenAI使得模型权重,推理代码,和样品提供给公众,使进一步的探索和创新。它是可用的在这里。
相关文章:微软引入Bing聊天,比人工智能文本生成特性,可用于打开预览