当前位置:主页 > 热点 >

搭建AI通往真实世界交互的桥梁,商汤“绝影开悟”世界模型再升级

时间:2025-07-29 15:02:53

  
 

  世界模型的价值不在于替代人类认知,而在扩展AI的物理边界。正如商汤CTO王晓刚所言:“我们搭建的是桥梁,而非终点。”

  2025年7月26日,世界人工智能大会在上海开幕,商汤绝影带来了升级后的“绝影开悟”世界模型。

  这款官方定义为“连接数字世界与真实物理世界”的技术产品,一方面展示了商汤在辅助驾驶领域的量产落地能力,同时也揭示了其向具身智能领域延伸的野心——通过构建4D真实世界模型,为AI搭建通往物理世界交互的技术桥梁。

  在辅助驾驶领域,“绝影开悟”的量产能力成为本次亮相的核心亮点。作为行业首个已实现量产的生成式世界模型,其技术价值已体现在产业实践中。

  此前,上海自动驾驶实训场建设成果发布,商汤绝影深度参与其中,以“绝影开悟”世界模型给自动驾驶实训场建设提供支持。

  目前,商汤绝影已与上汽集团旗下智己汽车打通Cut-in、碰撞等关键场景的数据生成链路,意味着这些高风险、低概率的驾驶场景可通过模型批量生成,无需依赖真实路测采集。

  双方的合作不止于此,据透露,未来将联合打造“数据工厂”,通过规模化生成场景数据,加速辅助驾驶系统的安全落地。

  这种模式的优势在于解决了传统路测的核心痛点:真实场景采集成本高、极端案例覆盖率低。例如,一场罕见的暴雨天气下的连环追尾场景,通过“绝影开悟”可在数小时内生成数千组变体数据,而真实采集可能需要数年等待。

  技术落地的背后,是产品化能力的支撑。

  本次世界人工智能大会上,商汤绝影正式发布辅助驾驶领域首个生成式世界模型产品平台,面向B端企业与C端开发者开放试用。

  该平台的功能体现在两方面:一是场景定制的灵活性,支持天气、光线、道路类型等多维度参数调整;二是“提示词生成”的便捷性,用户输入“雨天路面直行,前方有面包车在碰撞前刹停”等描述,即可一键生成对应场景。

  与之配套的,是业内最大规模的生成式驾驶数据集“WorldSim-Drive”。

  该数据集包含超100万段量产级数据,覆盖50余种天气光照条件、200类交通标牌及300类道路连接场景。

  比数据数量更关键的是数据质量。通过多视角时空对齐技术,模型可以同时生成第一视角与第三视角数据,且分辨率达1080P,时长支持分钟级连续记录,保真度接近真实采集数据。

  效率方面,“绝影开悟”基于单张A100 GPU,其每日生成的数据量相当于10台线台路测车的采集能力,效率约为500台量产车的总和。

  据悉,目前商汤绝影已有20%的训练数据来自该模型生成,大幅降低了对真实路测的依赖。

  “绝影开悟”的技术纵深,体现在其构建的4D实时交互训练场。其通过融合3DGS重建技术与世界模型生成能力,让4D交互训练场实现了三项进步。

  
 

  其一,大尺度高精度重建。模型能够对1km²范围内的真实空间进行高精度数字化重建,为车端模型提供接近真实的虚拟测试环境。

  其二,动态场景闭环生成。用户通过文本描述或场景布局设定,就可以触发“输入需求→生成场景→微调优化”的闭环流程,快速生成占道急刹、环岛绕行等复杂场景。

  其三,实时交互能力。策略模型与环境模型可以实现实时响应,从而确保仿真测试结果与真实驾驶的一致性。

  目前,4D实时交互训练场已在合作中落地。商汤绝影与智己汽车合作构建的测试场景库,已覆盖占道急刹、环岛绕行等典型场景,未来计划扩展至千万级规模,来覆盖几乎所有的驾驶可能性。

  在WAIC现场,观众还可以通过交互界面体验“虚拟驾驶”,例如在模型生成的暴雨天气高速场景中,实时操控车辆应对加塞,感受模型对物理环境的仿真精度。

  如果说智能汽车是“简单的具身智能”,那么机器人等硬件则需要更复杂的物理世界理解能力。

  这类具身智能面临的核心难题是“数据维度爆炸”,即机器人的传感器配置、移动方式远多于汽车,且需应对家庭、工业等多样化场景,传统数据采集方式成本高、效率低。更棘手的是“Sim2Real鸿沟”,即通过模拟工具生成的数据难以直接应用于真实场景。

  而商汤绝影的解决办法是将辅助驾驶领域的“虚实融合”数据迁移到具身智能上。

  
 

  首先,构建多模态时空对齐能力。通过多传感器融合技术,模型可将视觉、触觉等数据在时间与空间维度精准匹配。

  其次,生成高保线D环境。基于动态环境建模技术,模型能实时预测物体运动轨迹,例如预判家庭场景中宠物的突然跑动。

  最后,建立闭环验证体系。通过强化学习,机器人可以在虚拟环境中反复训练交互动作,再迁移至真实世界。

  支撑这一迁移的是商汤的具身3D资产库,其中包含了10万个线D资产,涵盖了家庭、办公、工业等20类场景的动作数据。

  更关键的是数据视角的完整性,模型既可生成机器人的“第一视角”,例如抓取物体的手部特写;也能生成“第三视角”,例如上帝视角下的机器人全身动作,从而解决了传统数据视角单一的问题。

  “绝影开悟”的进化路径,本质上是AI从数字世界走向物理世界的缩影。

  商汤科技联合创始人、CTO王晓刚在世界人工智能大会上表示,“绝影开悟”世界模型的核心价值在于“将AI创造力转化为生产力”,既为辅助驾驶提供场景数据,也为具身智能打造数据引擎。

  从辅助驾驶到机器人,从数据生成到实时交互,“绝影开悟”的技术逻辑都围绕一个目标:通过构建与线D模型,让AI在虚拟环境中“学会”与物理世界交互。

  当这种能力成熟时,或许我们将看到家庭机器人能精准预判老人起身时的动作辅助,工业机械臂能在复杂流水线中自主避障。而这一切的起点,正是世界模型这个连接数字与物理世界的技术桥梁。

热点推荐
1 Aave 新增部署至 X Layer

消息,ME News 消息,3 月 30 日,Aave 宣布将新增部署至 X Layer。初始资产清单包括 USDT、USDG、x...

2 币安将支持 Moonriver (MOVR) 网络升级

币安将于2026年3月30日UTC时间12:00左右暂停Moonriver 网络的充值和提现功能,以支持网络升级。此...

3 Ripple CEO:传统金融与加密货币连接战略见

消息,据Coin Bureau发推称:Ripple CEO Brad Garlinghouse 表示,行业正经历重大观念转变,全球一些最...

4 交易员 Loracle 开20 倍 BRENTOIL 空单,同步平

消息,据链上分析师 The Data Nerd监测,交易员 Loracle 于2 小时前开立价值 338 万美元的 20 倍空头...

5 AAVE加密货币跌破100美元,空头占据主导地

AAVE 已跌破关键心理关口 100 美元,目前交易价格接近 97 美元,日跌幅约为 7.7%。跌破短期移动...

6 未知钱包间转移1900枚BTC价值1.27亿美元

消息,据Whale Alert发推称:1900 枚比特币从一个未知钱包转移至另一个未知钱包。...

7 伊朗外交部发言人:美国经由斡旋方提出

消息,ME News 消息,3 月 30 日,当地时间3月29日,伊朗外交部发言人巴加埃表示,美国通过斡旋...

8 分析师:比特币短期持有者亏损扩大,

消息,据 CryptoQuant 分析师 Darkfost 表示,当前比特币价格在约 65000 至 70000 美元区间震荡,明显...

9 实时行情早报:SOL索拉纳价格跌破80美元

XBIT Wallet数据来源,索拉纳SOL今日行情消息,SOL索拉纳最新价格:$79.96,24小时跌-3.44%,交易量...

10 油价上涨或抑制比特币上行

消息,据Michal van de Poppe发推称:原油与大宗商品市场备受关注。Hyperliquid 平台上的原油周度期...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。