任职要求
1、计算机科学、人工智能、机器学习、数据科学或相关领域的本科或硕士学位。
工作经验: 至少3年以上机器学习或深度学习经验,且在大规模模型(如 GPT-3、T5、BERT 等)的设计、训练和部署上有实战经验。
2、深入了解LLM、MM-LLM、VLM、LMM等的架构、机制和训练方法,如 Transformer、Mamba、RWKV等。
3、具备大规模数据处理经验,熟练使用分布式计算和模型训练技术(如 GPU 集群、分布式训练框架)。
4、问题解决能力: 有较强的分析和问题解决能力,能快速适应并解决模型在生产环境中遇到的各种问题。