职位描述
岗位描述
协助AIGC算法部门,进行工程化落地,主要负责架构设计、部署、稳定性、性能优化等,推送项目落地,提高协作效率,让算法职能更加专注于效果。
岗位要求
算法工程(服务端)
岗位描述
负责公司核心算法服务的高性能服务端架构设计与开发,支撑日均千万级请求规模的在线推理与特征工程 pipeline;
将算法团队产出的模型(LLM、Embedding、CV、推荐等)高效工程化落地,完成模型加载、推理优化、服务封装及上线部署,确保 P99 延迟与可用性达标;
设计并实现高吞吐、低延迟的 RPC/HTTP 服务框架,负责模型推理服务的并发调度、动态批处理(Dynamic Batching)、KV Cache 管理及显存/内存资源优化;
构建算法服务的全链路可观测体系,包括推理性能监控、模型效果漂移检测、A/B 实验平台及弹性扩缩容机制;
与算法、平台、产品团队紧密协作,参与从需求评审到线上运维的完整生命周期,推动算法工程化标准与最佳实践沉淀。