江行智能:从感知环境到改变世界:物理AI的机遇、路径与实践
中国五层产业基础为物理AI打造全球最佳“试验场”
物理AI的竞争已从数字世界的模型参数之争,转向真实物理世界的系统能力之争。江行智能认为,中国拥有独特的五层产业基础,正成为全球工业物理AI落地的最佳土壤:
- 应用层:中国工业机器人安装量约为美国的8.6倍,过去十年增长约12倍,超高密度的工业场景为“数据-模型-具身智能机器人”闭环提供了天然优势。
- 能源层:中国发电量约为美国的两倍,发电机组装机量达美国三倍,充足的能源供给为AI从云端训练到大规模现场部署提供了底层支撑。
- 供给侧底座机会:能源、网络、基础设施及边缘节点的持续完善,为AI进入工业现场提供长期可靠支撑。
- 现场侧闭环机会:高密度工业场景、大规模机器人部署和多模态传感设备,让物理AI能形成“部署-采集-训练-迭代-再部署”的完整数据飞轮。
- 效率侧路线机会:高端芯片的约束倒逼行业走向更高效的模型、更强的边缘智能和更深的软硬协同,使工业物理AI更注重低成本、可控性和可部署性。

双引擎底座与三层模型架构,攻克工业AI落地核心难题
江行智能打造的全栈工业物理AI模型架构,以“双引擎底座+三层模型”为核心,解决训练更快、落地更稳、成本更低的问题:
- 底座层:JX-Phi World 采用AutoEdge与AutoWorld双轮驱动。AutoEdge负责边缘AI的快速部署与优化,AutoWorld则是世界模型仿真和数据引擎,通过生成式AI与3D重建技术模拟极端天气、突发事件等罕见场景,支持Sim-to-Real迁移,让AI在仿真环境中先犯错再部署到真实现场。
- 模型层:JX-Phi Brain 向工业场景WAM演进,包含三类核心模型:
- 空间视觉语言模型(S-VLM):解决“感知+理解”,能感知工业厂房的动态环境并理解传感器读数与行业规则。
- 长任务视觉语言动作模型(LT-VLA):解决“感知+执行”,将复杂工业任务拆解为可执行子任务并动态调整。
- 行业垂类模型:深度融合电力、化工、矿山等行业专业知识,理解强规则、强安全要求。目前已在1000+场站点位常态化采集数据,持续构建“模型+数据”闭环。
四大关键技术:让机器人“看得懂、执行稳、协同快”
江行智能提出四大关键技术,确保物理AI在复杂工业现场稳定运行:
- 动态可更新的工业场景底座:通过TrackerSplat技术解决动态场景中的稳定重建,能清晰抓取仪表盘数据并过滤雨滴、电磁干扰;SizeGS技术解决弱网环境下三维内容压缩与传输,确保决策稳定回传。
- VLA执行闭环与一脑多体协同:采用DyGRO-VLA技术与一脑多体系统,全局大脑完成语义理解、任务拆解、目标分配,具身终端执行导航、避障、读数等操作。一个简单的巡检任务在工业场景中需拆成100-200个子任务,并综合考虑地形、气候等环境因素。
新能源与电网两大标杆:从概念到规模化验证
江行智能已在核心领域实现规模化部署,证明物理AI从概念走向现实:
- 新能源领域:风、光场站物理AI运维系统。实现升压站、光伏板区、风机区等全域覆盖,7×24小时全天候巡检。已在600+站群级场景验证,传统人工巡检需30天以上,物理AI系统仅需2天完成全站巡检,彻底重构运维效率。
- 电网领域:变电站物理AI智巡系统。构建中枢大脑、具身大脑和可控终端协同体系,实现空地立体巡检。覆盖站内1万+高密度智巡点位,4小时内完成单次全站巡检,核心算法准确率99%,平均准确率96%。已覆盖全国27个省份,在国家电网和南方电网完成500+场景落地。