大模型数据算法实习生-视频&声音

上海稀宇科技有限公司| 北京/上海
实习产品 / 策划 / 项目本科
发布于 2026-06-09

职位描述

为我们的生成模型,构建和管理高质量、多样化的数据集。你的工作将直接决定模型所见所闻的质量,进而影响模型生成效果的上限。 主要职责 1、数据标准制定: 参与定义和刻画用于模型训练的高质量数据标准,包括但不限于视频&音乐的审美品质、内容多样性、技术参数。 2、数据搜寻与获取: 基于既定标准,主动在全球范围内的视频&音乐平台、开源数据集及特定渠道中,寻找和发掘符合要求的数据。 3、数据标注与评估: 可能需要对视频数据进行标签化、排序或质量评估,以构建更精准的训练指令。 4、跨团队协作: 与算法研究员保持紧密沟通,理解他们的数据需求,反馈数据质量情况,并协同解决数据层面的问题。

任职要求

我们希望你至少在以下一至两个方面有扎实的基础或突出的潜力 1、对数据的理解与审美:对视频&声音的内容有良好的感知和判断力,能清晰阐述“好”在哪里。 2、是深度的视频&声音模型用户,对国内外视频&声音模型产品有了解。拥有个人视频&音乐创作经验(如Vlog、短片剪辑),并能提供作品集优先。 3、数据获取与技术能力:具备基本的计算机基础,计算机科学、数字媒体、设计等相关专业优先。 4、能够与技术和算法团队高效协作,有较强的责任心,对数据质量负责。

相关职位推荐