任职要求
计算机、AI 等相关专业硕士在读或优秀本科生。
- 熟悉 Python/C++,有 CUDA 编程经验或 GPU 性能调优兴趣。
- 对深度学习模型架构与训练算法有基本理解,愿意深入学习计算特性与优化方法。
- 具备良好的工程意识与代码规范。
- 实习 3 个月以上优先,能长期实习更佳。
加分项
- 有 CUDA graph / 算子融合 / Triton kernel 开发经验。
- 有性能分析工具(Nsight Systems / PyTorch Profiler)使用经验。
- 有论文复现或相关研究经验。