职位描述
* 负责企业级 AI Agent 产品的功能测试、自动化测试及质量保障,参与产品全生命周期测试工作;
* 搭建和维护 Web UI 自动化测试框架,编写自动化测试脚本,持续提升自动化测试覆盖率和稳定性;
* 建设 Agent 自动评测体系,设计评测数据集、评测用例及评测指标,持续评估模型、 Agent 效果,支持版本效果对比与质量分析;
* 负责 API、Web 及 Agent 服务的性能测试,分析系统瓶颈并推动性能优化;
* 参与测试平台、评测平台及相关测试工具的开发与维护,推动自动化测试、评测体系与 CI/CD 流程集成;
* 熟练运用 Cursor、Claude Code 等 AI 开发工具提升测试研发效率,包括自动生成测试代码、测试数据、测试计划及缺陷分析报告,利用 AI 辅助日志分析、链路溯源、根因定位、失败复现以及 LLM-as-Judge 评测规则构建,持续推动测试智能化;
* 负责测试体系建设及团队管理,制定测试规范和质量标准,推动团队技术成长与工程效能提升,保障测试工作的高质量交付。