职位描述
1. 训练流水线建设: 搭建与维护多模态模型训练 Pipeline(涵盖数据预处理、实验追踪、Checkpoint 管理与回归评测),支持音视频、状态序列等多模态输入。
2. Teacher-Student 蒸馏: 使用大模型/专家模块生成 Richer Labels,设计蒸馏目标、Loss 函数与 Hard-negative 机制,将高价值能力稳定转移至端侧,摆脱对云端的在线依赖。
3. 模型压缩与部署优化: 负责 PTQ/QAT、量化感知训练、剪枝与 KV/Cache 优化;导出 ONNX/TensorRT 等格式;在真实设备上死磕 Latency、显存、功耗与推理抖动。
4. 质量与回归治理: 建立可复现机制,系统性归因模型失效(数据、标签、结构或部署问题);联合团队建设 Hard slices 与回放评测。
5. 运行时协同: 与系统侧拆分快慢路径,trade-off 端侧性能与业务收益,推动模型从“实验室能跑”跨越到“设备稳跑”。
6. 同时需要兼顾交互语义建模与任务定义(如回应对象判断、交互时机、主动策略等)