职位描述
1. 开发跨芯片训练和推理性能加速软件,包括并不限于国产 AI 算力芯片、海外主流训推芯片;设计并实现通用的算子库、模型并行策略及高效的显存管理机制等优化手段,对标 vLLM、Sglang 等业界前沿项目。
2. 开发面向业务用户的训练和推理应用的智能计算平台,支持多种大模型与算力芯片、从软硬件一体机、裸金属节点、自持集群到云计算多场景需求下的性能交付;
3. 基于清程Bagualu训练\chitu推理等 AI Infra软件栈,开发、推广面向开发者和系统集成用户的软件用例,参与开源社区建设,撰写高质量的技术文档、代码范例,并为社区开发者提供技术支持。
4. 构建基于Bagualu清程智能计算软件栈的业务应用(大模型预\后训练、推理、微调、RAG、工作流等)场景的清程 E2E 解决方案,构建从驱动到应用层的软件栈,封装易用的 API 和软件模块,服务于上层业务及开发者生态,交付 SOTA 性能优化服务。
5. 国产算力高性能关键模块开发,面向国产AI芯片,开展通用算子库优化、编译优化、Runtime到AI框架中的流水线优化等工作。
6. 负责国家科研课题申请与实施,完成科研课题支持。