高级CV算法工程师(视频算法方向)(J17391)

传音控股| 上海/深圳
社招硕士
发布于 2025-02-22

职位描述

- 负责研发和优化视频生成相关算法,包括基于深度学习的图像到视频、文本到视频等模型。 - 探索最新的生成模型技术(如Diffusion Models、GAN、Transformer等)并结合业务需求进行创新。 - 设计视频生成的整体技术架构,保证模型训练、推理和部署的高效性与稳定性。 - 协同前端、后端工程团队完成视频生成系统的产品化落地。 - 分析视频生成效果,持续优化模型质量、生成速度和用户体验。

任职要求

- 计算机、人工智能或相关专业硕士及以上学历,具有扎实的数学与算法基础。 - 熟悉视频处理相关的原理及技术,包括数据处理、帧插值、运动建模、时序一致性等。 - 精通深度学习框架(如PyTorch、TensorFlow),具备实际训练与部署经验;了解视频生成模型(如Wan系列)的训练、压缩与加速,以及GPU优化等工程化知识。 - 具备优秀的编程能力(Python/C++ 等),有良好的编码规范和调试能力。 - 具备独立的科研思维,能够阅读前沿论文并提出创新性改进方案。 - 具备团队合作精神、较强的沟通能力和学习能力。 加分项: - 参与过大规模视频生成项目或开源社区。 - 发布顶会论文者优先,如CVPR、ECCV、ICCV、NeurlPS、ICLR、SIGGRAPH或 SIGGRAPH Asia等。 领导力与影响力: 具备卓越的领导力和影响力,能够激励和引导团队成员,打造高效协作的团队文化,并推动团队不断突破技术瓶颈。

相关职位推荐