数据中心运维经理
所在地:上海市、成都市 发布时间:2026-04-12
1. 团队管理:全面负责运维团队的日常管理. 工作排班. 任务分配及绩效考核,搭建完善的团队培养体系,提升团队整体技术能力和运维服务水平,保障7x24小时运维服务落地执行;
2. 运维统筹:主导算力集群的整体运维工作,涵盖IB网络. ROCE网络及智算集群相关设备的日常监控. 巡检. 故障排查与应急处置,制定并优化运维标准化流程(SOP),降低故障发生率,确保算力集群可用性达标;
3. 技术管控:负责运维技术方案的制定与落地,跟踪IB. ROCE等主流智算组网技术及运维领域新技术动态,引入合适的运维工具与方法,推动运维自动化. 智能化升级,提升运维效率;对接硬件供应商. 网络服务商,协调解决复杂技术问题;
4. 服务保障:对接内部需求及外部客户,响应运维服务诉求,定期输出运维服务报告,优化服务流程,提升客户满意度;落实网络安全等级保护相关要求,做好运维过程中的安全管控. 日志审计及灾备演练工作;
5. 合规与成本管控:严格遵守相关合规要求,规范运维操作;合理管控运维成本,负责备件管理. 耗材采购的审核与统筹,优化资源配置。
岗位详情