6月1日,智行者宣布公司全无人物理AI商业化运营里程累计突破1.6亿公里,迎来新的里程碑。与此同时,更为重磅的是,基于这一混合复杂物理场景的大规模数据沉淀,智行者同步官宣物理AI世界模型——TransWorld。
该模型以多模态异构数据为底座、以细粒度物理交互信息为内核、以跨场景跨形态泛化为目标,通过三重异构数据采集、四级数据精炼蒸馏与五层金字塔模型架构,构建起闭环自进化的“物理AI飞轮”,标志着智行者的物理AI迈入数据驱动、模型进化、全域落地的全新阶段。
三重多模态异构数据集,夯实物理AI底座
“算法与算力搭建了物理AI的骨架,但真正决定其智力上限的,是数据的‘真实物理浓度’”,智行者董事长兼CEO张德兆表示,“算力可以通过资金的加持快速拉升,算法也可以依靠人才引进加速迭代,唯独高质量的物理世界数据无法速成——它必须深耕真实场景、在长期落地中逐步积累。这决定了数据是三大要素中时间壁垒最高、稀缺价值最突出的核心资产。”
正是基于这一战略认知,智行者选择区别于单一终端、单一场景的数据路线——成立11年来,通过布局极限作业、智慧清洁、智能出行等多元场景,智行者累计沉淀的1.6亿公里商业化运营里程数据,均具备多维度异构、多形态异构、多场景异构三大显著特征,作为核心资产,从三大维度实现对物理世界的深度穿透。
首先是维度异构。为赋予物理AI全面的感知能力,智行者搭载多元传感器阵列,实现全维度数据的深度融合:激光雷达实时感知三维空间,精准测算周围环境的立体结构、物体尺寸与距离;多视角摄像头负责捕捉多视角语义视觉,用于精准的物体与场景识别;超声传感器专注于近场感知,能够敏锐探测极近距离的障碍物与透明物体;IMU实时记录机器的加速度、角速度与姿态变化,让机器能够精准锁定自身运动状态;刷盘电机等执行器则用于捕捉地面摩擦力系数、接触力矩和材质阻力等物理参数,提供细粒度的接触反馈等力学交互信息;交互系统则能实时预判人车意图,积累丰富的动态博弈时序数据。
这种多传感器深度融合的全息数据,不仅记录了机器看见了什么,更完整记录了物理世界如何回应机器的每一个动作。例如,当蜗小白AI清洁机器人在人车混流的地下车库清洁时,其环境感知系统能迅速识别出各方向准备转弯的车辆。与此同时,其交互系统会预判车辆轨迹,推演出一条既能安全避让车辆,又能精准切入脏污区开展清洁作业的最佳路线。当蜗小白驶入湿滑地面时,底盘能敏锐感知到地面摩擦力的突变,系统随即动态微调,让机身保持平稳不打滑的同时,精准控制清洁刷盘的下压力,确保地面有效清洁。
视觉系统捕捉的三维画面、底盘感知的反作用力与人机动态博弈细节深度交融,沉淀为高价值的物理交互信号,这是传统仅靠“看路”的高速智驾无法获得的真实物理反馈,更有效填补了仿真环境难以覆盖的长尾交互盲区,为物理AI的深度训练提供了最稀缺、最真实的超级燃料。
第二是形态异构。智行者的数据并非局限于单一的终端形态,而是由统一的物理AI大脑统筹调度,驱动多形态智能体协同采集。数据来源覆盖蜗小白AI清洁机器人、蜗大白重型无人驾驶清扫车、提供应急巡检救援的极限作业智能体,以及服务于景区与公共出行的AI漫游车与Robobus。这种多元的移动智能体形态组合,使其数据天然具备了跨形态验证与泛化的条件——在清洁场景中学到的近场避障策略,可以迁移到巡检机器人的狭窄通道通行;环卫场景沉淀的雨天运行方案,也能为接驳车辆应对恶劣天气提供参考。
第三是场景异构。有别于多数物理AI公司数据局限于特定单一场景,智行者的数据资产全面覆盖混合复杂物理环境下的各类典型场景,横跨工业仓储、交通枢纽、商综楼宇、医院校园、公园景区,甚至是无地图的森林荒漠。无论重油污与金属反光干扰的工业制造车间、超大面积且高密度人流的交通枢纽,还是布满玻璃幕墙与狭窄通道的商业综合空间、无GPS信号的极险野外环境,均囊括在内。数据的全场景、深覆盖,以及完整的物理交互规律,为算法模型提供了丰富的真实世界教材,使其面对场景变量组合时,在泛化能力与真实环境执行性能之间保持平衡。
四级精炼蒸馏,炼就世界模型超级燃料
面对庞大的数据资产沉淀,如何才能真正释放其价值?答案在于实现从数据堆叠向数据精炼的跨越。张德兆指出:“在数据规模之上,通用智能的比拼更聚焦于数据价值,脱离了真实物理交互与复杂场景历练的数据只是没有生命力的数字。物理AI的护城河,在于是否有能力从海量里程中提纯出最细腻的物理规律与常识语料”。
为了将海量原始数据转化为驱动世界模型持续迭代的超级燃料,智行者针对1.6亿公里累计里程数据资产进行了体系化的四级分层拆解与数据蒸馏:
首先,基础级为脱敏多模态数据。它经过脱敏合规处理后,完整保留了从视觉、雷达、底盘执行机构全链路的所有物理反馈与交互轨迹,是整个数据资产体系的基底。这些数据可全面支持世界模型的自监督预训练和物理规律学习,让AI大脑在复杂的物理交互中自主内化出“物理直觉”。
在此之上,第二级提炼出结构化场景数据。这一级通过对连续的动态运行片段进行了细粒度的场景语义打标与精细聚类,如写字楼、工厂、公园等,将海量无序的轨迹转化为标准化的环境资产。这些数据应用在数字孪生空间中,作为仿真训练的环境模板,可为世界模型的推演与强化训练搭建起扎实、可拓展的基础场景库。
更进一步,第三级沉淀出交互与博弈数据。这些数据囊括了各类移动智能体在全速域与人机混流场景下的动态交互特征。例如,低速运行的AI漫游车在公园内礼让老人孩子;中速作业的蜗大白重型无人驾驶清扫车对穿行的外卖骑手妥善避让;极限作业智能体在高速状态下与救援车辆精准协同通行……这一系列覆盖多元真实场景、充满不确定性的微观互动序列,具备高信息密度,构成了训练物理AI非语言意图预判以及高阶博弈决策能力的最佳语料。
作为“黄金集”的第四级高质量标注数据,经过人机双重严格审核,实现了机器感知与物理执行的全模态对齐,可以将抽象的环境转化为带有精细物理属性的结构化切片。例如,当蜗小白AI清洁机器人驶过带油污的地库减速带时,这层数据会明确且精细地标注出“视觉识别为反光积液区域、雷达精确定位前方有6厘米高的物理凸起、底盘驶过时记录下摩擦系数瞬间降低40%并伴随瞬态的垂直冲击力”。这种教科书般的高精度标杆数据不仅构成了AI理解物理常识的核心骨架,更在强化学习阶段中承担奖励评判职能、清晰界定优劣行为。有了这套客观的评分依据,模型在推演试错时就有了清晰的进化方向,在发生失误时也能精准回溯并完成复盘。
通过不同模态的穿透、丰富终端形态的交融、混合复杂物理场景的规模优势以及四级数据体系的精炼,智行者已沉淀出不可复制的核心数据资产,为世界模型的运转、迭代提供坚实的数据底座。
五层金字塔架构,驱动物理AI进化
基于1.6亿公里高价值数据沉淀,智行者打造出TransWorld世界模型。TransWorld采用五层金字塔架构,从底层多模态感知到顶层跨场景跨形态泛化,形成完整的闭环自进化体系,精准回应了混合物理环境交互密集、人机行为博弈复杂的现实需求。
在技术维度上,五层金字塔架构自下而上实现了从环境感知到通用智能的跨越式演进:
作为整套模型的逻辑起点,最底层的L1多模态感知基座层通过对多模态传感器数据的深度融合与对齐,将视觉、力学、本体感知等多模态数据特征凝练为结构化的统一环境表征,建立物理时空一致性。相较于传统纯视觉方案,这一层数据信息维度更全、感知更立体,为构建覆盖低速、中速、高速的全速域数据集提供了关键基础。而基于这些数据训练的物理AI大脑,能更全面、精准地捕捉物理世界的丰富细节。
在此基座之上,作为TransWorld差异化亮点的L2物理常识内化层,从底层的海量感知数据中提炼摩擦、惯性等运动力学规律与物体恒常性这类对象属性规律,构建起模型专属的“物理常识脑”。这一层使模型能够深刻理解机器动作与物理世界反馈之间的因果关联,进而获得推演未来状态的能力——即使面对未曾见过的场景与物体形态,只需理解其底层物理属性,即可预判交互结果。这种超越对训练数据的简单模仿、实现对物理因果深层把握的能力,正是突破泛化瓶颈的关键所在。
凭借内化的物理规律,L3物理世界仿真层在数字孪生空间中构建出规模化虚拟仿真环境。相较于真实数据采集,仿真数据边际成本趋近于零,可无限生成、复制与分发海量样本,突破真实数据的规模上限与复用局限,并且场景参数可控,精度远超人工标注。基于这些优势,L3层得以在虚拟空间中搭建起覆盖全速域、全场景的仿真训练工厂,源源不断地为上层模型训练与验证供给高质量、多样性的样本。
然而,仿真环境与真实物理世界之间始终存在难以消除的域偏差——无论仿真如何优化,都无法完全复刻真实世界的所有物理细节。为此,L4强化学习训练层承担了打通虚拟与现实能力映射的关键职能:以仿真训练获得的策略作为初始先验,在真实数据上针对性微调,校正模型对仿真的依赖。通过仿真与真实数据的闭环迭代,推动不同形态的移动智能体从“在仿真中学会思考”逐步走向“在现实中稳健行动”。
最终,为了让“同一个大脑”能够指挥“千姿百态的身体”,位于金字塔最顶端的L5泛化推理层,突破了将底层物理认知迁移到不同智能体和不同场景的泛化瓶颈。核心机制在于,将前期沉淀的物理规律抽象为与具体硬件外形无关的通用表征,并引入一个“形态适配器”。适配器会根据不同终端设备的运动特性和作业场景,自动将通用经验翻译成适合该设备的控制指令。这意味着,无论是AI清洁机器人、AI漫游车还是极限作业智能体,新设备无需从头开始积累交互数据,只要给定少量适配样本甚至完全零样本,就能直接获得较高的执行性能,实现“一次学习,多形态部署”的能力闭环。
TransWorld“五层金字塔”架构绝非一个静态技术栈,而是一个具备自进化能力的有机生命体。从L1汲取多模态养分,到L5赋能千姿百态的智能体,泛化到不同的场景变量,物理AI每一次跨形态跨场景的成功落地,都在为整个系统注入源源不断的真实世界交互语料。这些语料向下反哺基座认知,向上滋养推理策略,让模型在正向循环中实现持续迭代进化,形成闭环自进化的“物理AI飞轮”。这种不受制于特定硬件形态、能够在真实混合物理世界中持续进化的自我驱动力,正是智行者引领物理AI跨越技术奇点、重构生产力的引擎。
1.6亿公里不是终点,而是AI时代下全新征程的起点。未来,智行者将以TransWorld为超级基座,依托持续进化的物理AI大脑,加速打造全球领先的移动智能体平台,进一步推动数字智能与物理世界的深度融合、双向赋能,让万物拥有自主移动的能力,构建人机共生、更安全、更高效、更美好的世界。