职位描述
1. 面向具身智能应用场景(机器人操作、移动感知与决策、长时序交互等),研究预训练多模态大模型在端侧(On-device / Edge)运行的高效推理机制。
2. 针对视觉–语言–状态–动作等多模态输入特性,设计低延迟、低功耗、强鲁棒性的推理架构与执行策略。
3. 探索并实现多模态大模型的结构化推理优化方法,包括但不限于模型裁剪、模块化执行、条件计算(Conditional Computation)、Early Exit 等。
4. 研究适用于端侧部署的模型压缩与适配技术,如量化、蒸馏、Adapter/LoRA、稀疏化及其在具身任务中的性能–效率权衡。