ai算法工程

回响科技| 上海
社招研发本科
发布于 2026-06-17

职位描述

岗位描述 协助AIGC算法部门,进行工程化落地,主要负责架构设计、部署、稳定性、性能优化等,推送项目落地,提高协作效率,让算法职能更加专注于效果。 岗位要求 算法工程(服务端) 岗位描述 负责公司核心算法服务的高性能服务端架构设计与开发,支撑日均千万级请求规模的在线推理与特征工程 pipeline; 将算法团队产出的模型(LLM、Embedding、CV、推荐等)高效工程化落地,完成模型加载、推理优化、服务封装及上线部署,确保 P99 延迟与可用性达标; 设计并实现高吞吐、低延迟的 RPC/HTTP 服务框架,负责模型推理服务的并发调度、动态批处理(Dynamic Batching)、KV Cache 管理及显存/内存资源优化; 构建算法服务的全链路可观测体系,包括推理性能监控、模型效果漂移检测、A/B 实验平台及弹性扩缩容机制; 与算法、平台、产品团队紧密协作,参与从需求评审到线上运维的完整生命周期,推动算法工程化标准与最佳实践沉淀。

任职要求

岗位要求 计算机基础扎实:精通数据结构与算法,熟悉操作系统、计算机网络及分布式系统原理; 服务端开发经验:3 年以上服务端开发经验,精通 Go 或 C++,具备高并发、高可用分布式系统的设计与调优经验; 算法工程化能力:熟悉至少一种深度学习框架(PyTorch / TensorFlow / ONNX Runtime),具备模型推理优化经验(TensorRT / vLLM / Triton / TorchServe),了解量化、剪枝、蒸馏等加速手段; 工程素养:熟悉 Docker / Kubernetes 云原生技术栈,具备 CI/CD、服务治理、多环境部署经验;熟悉 gRPC / HTTP2 协议及 Protobuf 序列化; 加分项: 有大模型推理服务(LLM Serving)或 RAG 系统架构经验; 熟悉 GPU 编程(CUDA / cuDNN)及显存优化策略; 有 Milvus / Faiss / ElasticSearch 等向量检索引擎的运维或二次开发经验; 参与过开源项目或在 GitHub 有高质量技术输出; 熟悉 Python,具备快速复现算法原型的能力。

相关职位推荐