广

多模态大模型算法实习生(北京)

广州荔支网络技术有限公司| 北京
实习研发本科
发布于 2026-04-24

职位描述

1、探索语音、视觉与多模态大模型深度融合的新架构与新方法,跟踪并应用的业界最新研究成果; 2、参与高效微调SFT、对齐RLHF等环节,优化模型在语音识别、图文理解、内容生成等任务上的性能。

任职要求

1、本科以上学历,计算机、人工智能、电子工程、数学或相关专业; 2、熟练使用PyTorch,能够独立完成模型搭建、后训练和调试; 3、深入理解Transformer架构及其在语音,CV和NLP领域的经典应用如Whisper,ViT, LLaMA等,熟悉多模态任务的基础理论和算法; 4、熟悉大模型的训练、微调(Fine-tuning, SFT)、强化学习(RLHF)等后训练(Post-Training)流程。了解模型轻量化技术,如量化、剪枝、蒸馏等。 5、对ASR/VIT/Flow Matching等语音/图像/视频生成技术有项目经验是加分项。 ***优先27届能长期实习同学,或26届晚于6月毕业同学

相关职位推荐