最近看物理 AI 和具身智能,一个明显变化是:行业注意力正在从“机器人本体有多强”,转向“机器人到底在哪里训练”。
机器人从 Demo 走向家庭、园区、工厂和城市后,真正难的不是完成一次展示动作,而是在真实世界里稳定完成千百次任务。这需要足够多、足够真实、足够低成本的训练环境。今年以来,北京、上海、长三角、常州等地都在推进具身智能训练场、数据采集基地和虚实融合训练平台。训练场热起来,本质上是因为行业开始重新认识真实空间数据的价值。

图源网络
下一阶段的机器人训练场,可能不只是固定实验室,也不只是仿真软件,而是由真实空间数据驱动的数字训练场。
这也是我最近重新看如视时,觉得它很有意思的原因。
很多人认识如视,是因为 VR 看房、三维空间重建和数字孪生。过去十年,如视一直在做空间数字化:用三维重建和 AI 技术,把真实空间转化为可展示、可管理、可分析的数字资产,也因此形成了自己的技术壁垒。
但放到物理 AI 时代看,这件事有了新的含义。
如视真正沉淀下来的,不只是三维重建能力,也不只是空间智能解决方案,而是一批来自真实世界、高质量、可计算、可用于具身智能训练的空间数据。

公开信息显示,截至 2026 年一季度,如视累计采集数字空间已突破 5800 万,覆盖面积超过 48 亿平方米。这些空间来自真实世界,覆盖居住空间、商业空间、城市空间、产业园区等多元场景,天然包含复杂户型、真实尺度、遮挡关系、空间连接和大量长尾环境。
在具身智能训练的语境下,如视数据规模的价值会被重新放大。
相比人工搭建的有限训练场,如视的真实空间数据拥有更大的规模和更丰富的场景覆盖;相比纯合成仿真数据,它又更接近真实世界本身。
更关键的是,如视的数据并不是简单的全景影像或空间图片。通过激光设备采集、三维重建、语义结构化和空间理解,这些真实空间可以转化为具备几何结构、语义信息和场景关系的训练样本。

机器人可以从中学习真实环境里的通行规则、遮挡关系、区域连接、物体分布和任务约束;进一步看,还可以支持对单体物品材质、接触关系、摩擦力等物理属性的建模,为操作、导航、避障和任务规划提供更接近现实的训练基础。
这也是如视切入具身智能训练场的独特位置。
在行业里,很多训练场是从机器人本体或数据采集任务出发,先搭场地,再组织机器人进入场景采集数据。如视则是从真实空间数字化出发,过去多年已经沉淀了大规模真实三维空间数据,并形成了“采集、重建、结构化、任务生成、高保真增强、开放交付”的数字空间能力链条。
换句话说,当行业开始意识到“真实场景数据”稀缺时,如视手里已经有了一张覆盖大量真实空间的底图。而且这张底图不是一座不变的“固定资产”,而是每天都在增长的“动态数据库”。如视每天都有数千名专业摄影师持续采集真实空间数据,新的空间、新的场景、新的细节不断进入这套数据体系。
从技术路径看,如视的价值也不止于提供静态空间。真实空间可以被持续采集、重建和结构化,再进一步转化为适合机器人训练、评测和迭代的数据形态。例如,基于真实空间生成具备几何一致性的多视角操作运动视频,构建高质量 3DGS 训练场景数据,沉淀带有空间结构、业务语义和任务约束的训练样本。
更有想象力的是,如视这些真实场景,经过三维重建、语义结构化、任务生成和多视角运动轨迹扩展后,可以进一步衍生出近 3000 万小时的训练数据。
更进一步,如视正在构建的 Real2Sim2Real 闭环,也契合当前具身智能行业的主流方向。
Real 阶段,如视通过高精度激光设备伽罗华采集和重建真实空间场景;Sim 阶段,通过空间理解、结构化提取等能力打造1:1仿真的训练环境,机器人可在孪生体进行低成本、安全可控的训练和评测;再回到 Real 阶段,模型部署到真实场景后,新的运行数据继续回流,反向优化仿真环境和训练效果。如视打造的这条闭环,正是缓解 Sim2Real gap 的关键路径。

从北京、上海到长三角,具身智能训练场正在成为新型 AI 基础设施。它不再只是让机器人“练动作”的地方,而是生产高质量物理世界数据、验证模型泛化能力、连接真实场景和仿真环境的数据工厂。
如视的不同之处在于,它不是等风口来了才去搭一个训练场,而是早已把真实空间数据、三维重建能力和数字孪生底座准备好。过去,如视把真实空间数字化,是为了让人更好地看房、看店、看展、巡检和管理空间;现在,这些真实空间数据正在成为机器人理解真实世界的训练场。
当机器人训练场成为新风口,如视已经站在了真实空间数据的入口处。
关键词: