工作職責(zé):
?1、負(fù)責(zé)大數(shù)據(jù)集群建設(shè)、運維、管理、優(yōu)化監(jiān)控告警,保障平臺服務(wù)穩(wěn)定可靠運行;
?2、深入理解大數(shù)據(jù)平臺架構(gòu),發(fā)現(xiàn)并解決性能瓶頸,支撐任務(wù)量和數(shù)據(jù)量的快速增長;
?3、開發(fā)大數(shù)據(jù)自動化運維、監(jiān)控告警、故障處理相關(guān)工具和應(yīng)用;
?4、負(fù)責(zé)Hadoop及生態(tài)圈相關(guān)組件的集群服務(wù)、任務(wù)監(jiān)控、應(yīng)急響應(yīng)、容量規(guī)劃,性能分析等;
?5、組建和管理運維團(tuán)隊,支撐系統(tǒng)交付。
?任職資格:
?1、熟悉Hadoop、Hive、Yarn、Spark、Kafka、Elasticsearch、Flume、Flink等組件的工作原理,并有3年以上的大數(shù)據(jù)生態(tài)系統(tǒng)的部署及維護(hù)經(jīng)驗;
?2、掌握Linux操作系統(tǒng)的配置,管理及優(yōu)化,能獨立排查及解決系統(tǒng)層的各類問題;
?3、能夠閱讀開源組件源碼,有一定組件源碼優(yōu)化經(jīng)驗;
?4、具有較強的學(xué)習(xí)能力、邏輯分析能力、問題排查能力;
?5、具有相關(guān)項目管理經(jīng)驗,良好的溝通與協(xié)作能力,誠信可靠。