大模型数据工程实习生

算秩未来| 北京/上海
实习研发本科
发布于 2026-04-21

职位描述

1、协助AI平台数据架构及持续演进,配合满足不同场景下的大模型预训练、后训练、评估等数据需求 2、参与研发与维护数据pipeline,协助完成数据的采集、存储、筛选、清洗、标注和质量评估等工作 3、协助分布式数据加速系统的相关开发和测试,支持数据访问与存储性能的优化 4、与算法工程师及其他研发人员协作,协助完善数据处理工具和流程规范,支持算法工程落地 5、调研业内前沿的大模型开源数据集与技术,协助进行数据质量分析和效果验证

任职要求

1、本科及以上学历在读,计算机、人工智能、软件工程等相关专业优先 2、对机器学习、大模型或数据处理有一定了解,熟练掌握Python,有数据清洗或特征提取相关课程或实践经验者优先 3、了解或有兴趣学习大数据处理工具(如Spark、Flink、Ray等)及相关技术 4、了解基础的计算机网络、操作系统、分布式系统等计算机科学基础知识 5、具备较强的学习能力、沟通能力和团队合作精神,能够独立思考并在指导下完成相关工作 6、每周可保证实习 4-5 天,能够连续实习 3 个月及以上者优先

相关职位推荐