职位描述
1、TVLA模型前沿研发:负责具身多模态大模型的算法研发,主导触觉(Tactile)、力矩(Force/Torque)等多维连续传感数据的特征提取、Token化设计,实现力觉与视觉、语言等模态在VLA架构下的深度融合与闭环控制。
2、多源数据联合训练(Co-training)探索:深入调研并主导类UMI采集数据与真实机器人端到端数据的联合训练机制,设计高效的混合训练策略。
3、跨形态数据对齐(Alignment):解决跨形态(Cross-embodiment)数据分布差异,设计并优化特征对齐或域适应(Domain Adaptation)算法,消除 UMI 演示数据与真机物理交互数据之间的 Domain Gap,实现两者的高度 Alignment,从而提升模型在真机上的泛化性与复杂操作成功率。
4、移动操作(Mobile Manipulation)架构设计与研发:探索底盘移动与机械臂操作协同的端到端框架。负责设计支持 WBC(Whole-Body Control,全身控制) 的统一架构,打通高层大模型(策略输出)与底层运控层(动力学解算)的壁垒,解决高低频控制解耦与平滑过渡问题,实现高精度移动操作。