9月23日,智元机器人宣布GO-1(Genie Operator-1)通用具身基座大模型正式全面开源。这是继今年1月AgiBot World具身智能百万真机数据集开源后,智元机器人的又一次行动。本次开源标志着全球首个采用Vision-Language-Latent-Action (ViLLA)架构的通用具身智能模型向全球开发者 ...
12月5日凌晨,就在OpenAI宣布将于未来12天连续进行12场发布会直播时,Google DeepMind同时在官网发布了大型基础世界模型Genie 2,可通过单张图片和文字描述生成种类多样的可玩3D世界。作为今年初推出的 Genie 模型的升级版,Genie 2标志着人工智能在虚拟世界生成领域 ...
智东西12月5日报道,AGI竞赛愈演愈烈!就在OpenAI宣布将于未来12天直播新发布和demo前,昨夜,Google DeepMind发布大型基础世界模型Genie 2,能生成各种可控制动作、可玩的3D环境,还可以用于训练和评估具身agent。 只要给一张提示图像,Genie 2就能按照你输入的文本 ...
智东西8月6日消息,昨夜,谷歌DeepMind宣布推出通用世界模型Genie 3,首个可实时交互世界模型来了。 基于文本提示,Genie 3可以允许用户以每秒24帧的速度,以720p的分辨率生成长达数分钟的交互式3D环境,Genie 2仅能生成10到20秒。 去年年底,谷歌DeepMind发布能生成 ...
谷歌Genie3:文本生成交互空间,探索名画,3D沉浸体验! 谷歌最新发布的Genie 3世界模型,正以惊人AI能力颠覆想象:从文本生成交互式空间,到进入经典名画如《苏格拉底之死》和《夜游者》自由探索,甚至训练3D模型实现沉浸式体验! 谷歌摊牌了,彻底不装了!