崗位職責(zé):
1、負(fù)責(zé)基于Hadoop/Hbase的存儲(chǔ)平臺(tái)架構(gòu)設(shè)計(jì)和優(yōu)化;
2、負(fù)責(zé)整體提升Hadoop/Hbase集群的高可用性、高性能、高擴(kuò)展特性;
3、根據(jù)業(yè)務(wù)需求,提出最優(yōu)的技術(shù)解決方案;分解詳細(xì)的開(kāi)發(fā)任務(wù),能配合其他項(xiàng)目制定開(kāi)發(fā)計(jì)劃、開(kāi)發(fā)文檔、開(kāi)發(fā)流程圖;
4、負(fù)責(zé)帶領(lǐng)項(xiàng)目及培訓(xùn)團(tuán)隊(duì),指導(dǎo)技術(shù)團(tuán)隊(duì)完成數(shù)據(jù)規(guī)則的定義、數(shù)據(jù)模型的建立、數(shù)據(jù)清洗、數(shù)據(jù)遷移等工作;
5、負(fù)責(zé)數(shù)據(jù)架構(gòu)的規(guī)劃,并制定實(shí)施標(biāo)準(zhǔn)和規(guī)范,確保得到有效的執(zhí)行,同時(shí)保障數(shù)據(jù)以及文檔的質(zhì)量達(dá)到預(yù)定的標(biāo)準(zhǔn)。
崗位要求:
1、 全日制本科及以上學(xué)歷,計(jì)算機(jī)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等相關(guān)專業(yè);
2、 5年以上數(shù)據(jù)挖掘工作經(jīng)驗(yàn),至少有1-2個(gè)大數(shù)據(jù)挖掘項(xiàng)目的成功案例;
3、 精通分布式計(jì)算原理,有海量數(shù)據(jù)處理和分布式算法調(diào)優(yōu)能力,包括Hadoop相關(guān)組件或?Spark;
4、 熟練掌握數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)基本算法,包括:回歸分析、決策樹(shù)、SVM、協(xié)同過(guò)濾、聚類、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等;
5、 精通數(shù)據(jù)挖掘相關(guān)工具,如:R、python、java、C/C++、matlab等;
6、 精通數(shù)據(jù)庫(kù),如:MySQL或Oracle等,精通SQL語(yǔ)言;
7、 具備很強(qiáng)的自我驅(qū)動(dòng)力和學(xué)習(xí)能力;
8、 邏輯思維能力強(qiáng),具備較強(qiáng)的溝通能力,有團(tuán)隊(duì)合作精神;
9、 有互聯(lián)網(wǎng)或車聯(lián)網(wǎng)行業(yè)經(jīng)驗(yàn)優(yōu)先。