职位描述
1. 研究三维重建方法,包括MVS,3DGS 和VGGT类技术,实现从单目/多视图,单帧/多帧,到高质量三维场景的云端离线重建,以及蒸馏到端侧进行实时重建。
2. 优化三维重建模型的泛化能力、几何精度与渲染效率,支持跨本体,探索更高效的3D表示与可微渲染技术。
3. 具备高精度,高泛化的视觉定位和空间记忆能力,并部署到端侧。
4. 研究将VLM与三维空间重建结合的基础模型,支持在三维空间的Grounding和空间理解能力,以及设计面向机器人操作与导航的感知-理解-决策一体化架构。
5. 研发视觉、语言与空间记忆的VLN算法,使机器人能够理解自然语言指令,在未知环境中自主规划路径,安全顺利的完成导航任务,并具备记忆能力。
6. 构建大规模4D场景数据集,设计自监督/弱监督预训练任务,提升模型在开放世界中的鲁棒性。
7. 算法工程落地与前沿创新,负责算法的部署与优化,包括模型压缩、量化、端侧加速。
8. 持续跟踪顶会最新成果,将创新技术转化为专利或顶会论文,保持技术领先性。