发布日期:2024-03-20 14:05:23
近日,明势资本投资的天使轮项目「逐际动力LimX Dynamics」旗下双足机器人P1,在深圳郊野的塘朗山公园进行了零样本、无保护、全开放环境的实地测试。
这款基于强化学习(RL)技术的机器人,在完全陌生的自然环境中展现出了卓越的控制力与稳定性,成功完成了在多种复杂地形上的移动。逐际动力P1的这一成就,标志着它成为了中国首个在野外环境中实现徒步功能的双足机器人。
2023年10月,逐际动力宣布完成了近2亿元的天使轮和Pre-A轮融资,其中明势资本是主要的天使轮投资方。多家知名风险投资机构的联合投资,为逐际动力在机器人与人工智能融合、关键产业资源整合等方面提供了有力支持,推动了其技术创新与产品落地。
同年年底,逐际动力发布了国内首款具备实时感知能力的人形机器人动态测试成果。
逐际动力在强化学习领域拥有深厚的积累,目前正专注于将这一前沿技术转化为系统化的研发能力,以支持其产品的功能开发。
公司提出了独特的强化学习研发体系,包括Real2Sim2Real闭环、神经网络架构设计、数据生成与训练算法设计等三大核心板块。这些技术与不断完善的流程管理和算法验证相结合,共同推动了人形机器人关键功能的开发进程。
双足机器人P1在狭窄沟渠中高动态稳定行走
P1作为逐际动力在中国率先推出的创新型双足机器人,不仅是公司强化学习系统化研发与模块化测试的重要平台,更是推动双足基础运动能力研发与迭代的关键力量。
P1在野外森林中的成功表现,充分展示了逐际动力强化学习系统化研发的成果以及三大核心板块技术的实力。
双足机器人P1在猛烈击打下表现出强大的抗干扰能力
Real2Sim2Real闭环
在Real2Sim2Real闭环方面,逐际动力实现了从实际环境到仿真模型再到实际环境的无缝衔接。无论是采集物理世界数据生成仿真模型,还是将仿真后的策略部署到硬件上,逐际动力都致力于实现全过程的自动化,以最大限度减少人工干预,缩小仿真与现实之间的差距,从而提高训练的效率和质量。
神经网络架构设计
在神经网络架构设计方面,逐际动力将神经网络视为一个科学的、系统化的复杂结构,其设计体现了团队的特点和实力。公司打造的神经网络架构能够有效应对环境交互和硬件差异带来的干扰,生成具有自适应性的控制策略,使同一个神经网络能够适应不同的机器人和场景需求。
数据生成与训练算法设计
在数据生成与训练算法设计方面,逐际动力注重解决有效数据稀缺的问题。公司提出了迭代式预训练方法,将通用机器人的基础运动能力划分为不同级别进行循序渐进的预训练。这种方法使训练结果更加可控,从而高效地产生和收集有效数据,训练出高性能的策略。
双足机器人P1在崎岖山路上行走自如
此次测试中,野外环境与实验室和城市环境存在显著差异,如地形多变、地貌复杂等。然而,P1在没有输入任何与森林或徒步相关数据的情况下,依然能够适应全新环境并在变化无常的森林中自如行走。这得益于逐际动力系统化的强化学习训练方法,确保了研发成果在实际应用中的可行性、可用性和可靠性。
双足机器人P1在野外森林进行零样本、无保护、全开放测试
具身智能研发涉及硬件、算法、数据和算力四大要素,其中强化学习在算法中占据重要地位。逐际动力强调系统化的研发流程和能力建设,P1的成功表现证明了这一技术路径的先进性。
除了移动控制方面取得的突破外,逐际动力还在操作和移动操作方面对人形机器人进行持续攻关,并期待在未来发布更多新的进展。
逐际动力系统化的强化学习训练,保证研发成果在实际应用中可行、可用、可靠
扫一扫关注公众号