高级CV算法工程师(AIGC方向)(J19268)

传音控股| 深圳/上海
社招硕士
发布于 2026-02-28

职位描述

1、负责手机端与云端 AIGC 影像算法研发,包括人像生成、图像修复、人像编辑、视频生成、文生图 / 图生图等核心能力的算法设计、实现与优化(任一方向)。 2、负责扩散模型、MMDiT、流模型(Flow Matching / Rectified Flow)、单步生成模型等前沿生成式模型的研发、微调、蒸馏与推理加速。 3、负责 AIGC 基础模型的后训练体系建设,包括 SFT、DPO、GRPO 等强化学习方案设计与落地,构建大规模指令微调数据与奖励模型。 4、针对弱光、逆光、中低端机型、海外用户习惯等复杂场景,设计稳健高效的人像处理、图像编辑与视频生成方案。 5、参与构建手机影像 AIGC 完整技术体系,包括数据 pipeline、模型评价体系、端云协同架构、训练与部署流程建设与优化。 6、跟踪业界前沿技术,推动图像 / 视频生成、编辑、增强等创新能力在手机影像产品中稳定、高效、差异化落地。

任职要求

1、计算机、人工智能、电子信息等相关专业,硕士及以上学历,具备扎实的数学、深度学习与计算机视觉基础。 2、熟悉主流生成式模型,如扩散模型、MMDiT、Flow-based、GAN、Transformer等,了解人像、图像、视频相关 AIGC 技术。 3、熟练使用 PyTorch 等深度学习框架,具备模型训练、调试、优化与工程落地能力;了解 TensorRT、ONNX 等模型部署与端侧加速优先。 4、熟悉以下至少一个方向: -人像编辑 / 增强 / 美颜 / 自拍算法 -视频生成、时序建模、帧插值、视频一致性 -大模型 SFT、指令微调、Reward Model、RLHF/DPO/GRPO 等后训练技术 5、具备优秀的论文阅读与算法创新能力,有顶会论文、开源项目、大规模项目落地经验者优先。 6、对手机影像与 AIGC 方向有强烈热情,具备良好的跨团队协作与项目推动能力。 加分项 1、有人像编辑、人像生成、视频生成、多模态基础模型研发经验 2、有 SFT/RLHF/DPO/GRPO/RLAIF 等模型对齐与强化学习落地经验 3、熟悉端云协同推理、模型量化、压缩、蒸馏、加速等工程化技术 4、有大规模编辑 / 视频数据构建、模型训练与迭代经验 5、在 CVPR/ICCV/ECCV/NeurIPS/ICLR/SIGGRAPH 等发表论文或有知名开源项目

相关职位推荐