工作职责:
1、配合搭建、配置和管理智能监控系统,确保对各类系统、应用程序、网络设备和基础设施的全面监控;
2、配合对多源数据进行整合、清洗和预处理,确保数据的质量和一致性,为后续的分析工作提供可靠的数据基础;
3、配合运用数据分析技术和工具(如统计分析、机器学习、数据挖掘算法等)对运维数据进行深入分析;
4、负责运用智能诊断工具和技术辅助故障诊断过程,提高诊断的准确性和效率;
5、协助协调相关技术团队和资源,及时解决故障,恢复系统的正常运行,并对解决过程和结果进行记录和总结;
6、协助设计和开发自动化运维流程和脚本,实现日常运维任务的自动化执行,利用自动化工具和技术(如 Ansible、Puppet、Chef 等)提高运维工作的效率和准确性,减少人为错误;
7、完成领导交办的其他工作。
任职资格:
1、硕士研究生及以上学历或取得相应学位,计算机、软件工程、应用数学、金融工程及相关专业优先;
2、了解至少一种监控工具(Prometheus )的配置与使用;
3、熟悉至少一种日志管理工具(如 日志易、ELK Stack、Splunk 等);
4、熟练使用版本控制工具(如 Git)和自动化部署工具(如 Jenkins、Ansible 等);
5、 具备一定的开发能力,能够编写运维脚本和工具,实现运维任务的自动化。