需要熟悉docker,最好熟悉k8s,懂互聯(lián)網云產品,像騰訊云、阿里云、百度云等(本科以上)
崗位職責:
1、建立和完善公司的技術監(jiān)控體系和事件處理機制,確保業(yè)務的穩(wěn)定運行;
2、配合產品研發(fā)組進行應用和服務的發(fā)布、部署、調優(yōu)、運營等工作;
3、參與容量規(guī)劃、架構優(yōu)化、容災優(yōu)化、性能優(yōu)化等運維級別項目;
4、通過各類監(jiān)控工具及相關報警信息,按分級及時處理故障,判斷故障類型、嚴重程度并執(zhí)行故障問題處理流程;
5、負責各類故障問題的跟蹤、記錄、總結及合理化建議;
6、建立和完善規(guī)范化的運維監(jiān)控體系,保障業(yè)務運行質量;
7、不斷研發(fā)與探索運維自動化及各類創(chuàng)新途徑,縮短運維響應時間,減低運維成本;
8、負責線上服務的監(jiān)控響應,解決運營中遇到的各種問題;
9、接收各部門故障匯報,?并及時跟蹤故障處理流程;
職位要求
1、互聯(lián)網公司3年以上運維經驗;
2、精通Linux系統(tǒng)管理,熟練使用shell、perl、python等至少一門腳本語言;
3、熟練掌握常見監(jiān)控軟件zabbix、cattic、Nagios、Open-Falcon等監(jiān)控軟件的使用;
4、具有分析大型應用系統(tǒng)架構并進行改進的能力,擁有快速排查系統(tǒng)瓶頸的能力;
5、熟悉監(jiān)控系統(tǒng)、自動化系統(tǒng)的原理及建設、維護和優(yōu)化者優(yōu)先;
6、具有較強的責任心、安全意識和文檔意識,具有良好的溝通能力及團隊精神;