智算云平台后端工程师-太初云

中科紫东太初| 北京
社招研发社招本科
发布于 2026-04-28

职位描述

岗位职责 核心架构设计:聚焦推理服务与MaaS(模型即服务)模块,遵循Cloud Native与AI Native理念,负责智算云平台核心功能的设计、开发与迭代,支撑大模型的高效部署与稳定调用。 推理服务优化:基于KServe、NVIDIA Triton等推理引擎,设计并优化推理服务架构,实现动态批处理、模型量化、模型预热等关键逻辑,适配GPU/NPU异构算力环境,保障服务的高并发处理能力与低延迟响应。 MaaS全流程建设:负责MaaS服务全流程开发,构建模型仓库与版本管理机制,封装标准化RESTful/gRPC API接口,打通从模型研发到线上推理的完整链路,结合容器化技术实现服务的弹性扩缩容。 异构算力调度:借助Volcano/GPU调度器,参与异构算力资源的管理与调度优化,实现推理请求与底层算力的高效匹配,提升整体资源利用率;依托Kubernetes核心能力(编排、自愈、服务发现),保障服务的长期稳定运行。 稳定性与可观测性:践行DevOps理念,配合CI/CD流水线落地服务自动化部署与迭代;构建服务可观测性体系(日志、指标、链路追踪),落地故障自愈、熔断降级、限流等稳定性能力,及时定位并解决线上性能瓶颈。 技术驱动与创新:独立推进模块设计与实现,撰写高质量技术文档;持续跟进智算领域前沿技术(如vLLM、SGLang、TGI等推理框架演进),推动推理服务与MaaS服务的持续优化与创新。

任职要求

任职要求 必备条件  本科及以上学历,计算机相关专业,3年以上后端开发经验。有智算平台、AI云服务、MaaS平台或推理服务开发经验者优先。  熟练掌握Golang或Python中的至少一种后端语言,熟悉微服务架构,具备扎实的编码能力与良好的代码规范意识。  深入理解Cloud Native与AI Native理念,熟悉Kubernetes核心原理(调度、网络、存储、RBAC),具有实际的K8s集群使用或管理经验。  熟悉Docker容器技术及容器运行时(containerd/CRI-O)基本机制,掌握K8s环境下的常见开发与运维实操技能。  了解AI推理技术栈,熟悉Triton Inference Server或KServe等推理引擎,了解大模型推理的基本流程(Prefill/Decode)及常见优化手段(连续批处理、张量并行等)。  了解至少一种CI/CD工具(如Jenkins、GitLab CI、ArgoCD、Tekton),熟悉DevOps流程,具备服务自动化部署与迭代的实操能力。  具备良好的问题排查能力与自驱力,能独立承担模块设计与实现,有优秀的沟通协作能力。 加分项  有大规模推理服务或MaaS平台商业化落地经验,熟悉主流MaaS产品(如阿里云PAI EAS、火山引擎方舟、HuggingFace TEI等)架构者优先。  熟悉GPU/NPU芯片特性,有华为Ascend CANN、NVIDIA CUDA开发经验,或精通Volcano调度器优化者优先。  有Kubernetes Operator、CRD开发经验,或对K8s ApiServer/调度器源码有一定了解者优先。  参与过Cloud Native、AI Native相关开源项目,或有KServe/Triton推理服务性能优化经验者优先。  熟悉主流深度学习框架(PyTorch/TensorFlow),能与算法团队高效协同,或有云管平台、可观测性系统(Prometheus、Jaeger、OpenTelemetry)研发经验者优先。

相关职位推荐