职位描述
- 负责深度学习模型(感知/预测/规划/VLA)在边缘端硬件(如 NVIDIA Orin、RK3588)的模型量化、加速与部署;
- 设计并实现模型压缩、量化、蒸馏等优化方法,提升推理效率并降低功耗;
- 针对不同硬件平台(GPU、NPU、DSP 等),优化算子性能,保证模型在实时性和准确性上的平衡;
- 跟踪学术前沿和产业实践,将最新的量化与高效推理技术应用于实际项目;
- 支持跨团队合作,协助算法、系统、硬件团队完成端到端的模型上线。
6、与智能驾驶、具身智能、数据平台等团队协作,推动世界模型在数据生成、场景评测与策略学习中的实际落地。