职位描述
负责VLN/VLM-Nav算法研发:视觉-语言-动作对齐、指令理解、路径规划与闭环执行
攻关部署态关键问题:长距离指令、模糊指代(“那边/旁边/刚才看到的”)、动态人群、遮挡与重定位
构建“语义导航”能力:语义地图/拓扑图、目标可达性判断、房间/区域识别、跨区域/跨楼层导航(如门禁/电梯)
端到端闭环优化:导航成功率、平均耗时、卡死率、误入禁区率、舒适度(停走抖动/路径自然性)
建立数据与评测体系:仿真与真机场景回放、对抗case库、自动化回归、线上失败归因与难例回流
与SLAM、感知、多模态理解、任务规划、控制团队协作联调,形成可部署可迭代的导航能力栈