职位描述
为我们的生成模型,构建和管理高质量、多样化的数据集。你的工作将直接决定模型所见所闻的质量,进而影响模型生成效果的上限。
主要职责
1、数据标准制定: 参与定义和刻画用于模型训练的高质量数据标准,包括但不限于视频&音乐的审美品质、内容多样性、技术参数。
2、数据搜寻与获取: 基于既定标准,主动在全球范围内的视频&音乐平台、开源数据集及特定渠道中,寻找和发掘符合要求的数据。
3、数据标注与评估: 可能需要对视频数据进行标签化、排序或质量评估,以构建更精准的训练指令。
4、跨团队协作: 与算法研究员保持紧密沟通,理解他们的数据需求,反馈数据质量情况,并协同解决数据层面的问题。