岗位要求
1 5年以上相关工作经验,大专以上学历,计算机及相关专业;
2 精通linux操作系统,对系统有深入理解;
3 精通至少一门脚本语言与静态语言,有大规模系统设计经验者优先;
4 熟悉TCP/IP与HTTP协议,对协议有深入理解与实际排错经验者优先;
5 熟悉容器技术与容器编排技术,有k8s生产运维经验者优先;
6 熟悉数据库原理,对常见数据库引擎有深入理解者优先;
7 对分布式分布式系统有深入理解,熟悉互联网常用开源基础组件(nginx,redis,kafka,mysql,hbase,zookeeper,hadoop等);
8 有大数据运维及开发经验者和机器学习算法经验者优先;
9 有持续集成/持续部署经验加分,有超大规模集群管理经验者优先;
10 责任心强,积极主动,热爱学习,注重团队合作;
11 加分项:熟悉运维常用的工具漏洞,以及linux服务器常见漏洞以及优化
岗位职责
1 负责部门核心系统和应用的线上监控和告警实施,保障系统的稳定运行;
2 参与线上突发事件管理,分析定位,处理和跟踪改进;
3 对系统进行资源统计,性能评估和容量规划;
4 推进部门devops落地,全方位建设提升运维能力(持续集成,应用发布,持续部署,监控告警,应急预案,智能运维等);
5 推进运维标准化,自动化和智能化(AIOps)