职位描述
岗位职责
参与智算云平台推理服务 / MaaS(模型即服务)模块的开发与维护,协助完成核心功能的后端实现与测试。
在导师指导下,基于 KServe、NVIDIA Triton 等推理引擎,完成推理服务的部署、接口封装与性能压测,了解动态批处理、模型量化等优化手段。
参与 MaaS 服务全流程建设,包括模型仓库接入、标准化 API 开发、服务容器化改造,打通“模型 → 服务”的工程链路。
学习并接触 Kubernetes + Volcano 调度体系,参与异构算力(GPU/NPU)资源的调度验证、资源监控与简单优化。
配合 CI/CD 流程完成服务的自动化部署与迭代,协助建设服务可观测性体系(日志、指标、调用链),处理基础稳定性问题。
撰写相关技术文档,参与技术调研,跟踪大模型推理、MaaS 等前沿技术,并能在团队内进行分享。