工作職責(zé):
該職位負(fù)責(zé)自研神經(jīng)網(wǎng)絡(luò)芯片AI?推理框架的開發(fā),優(yōu)化和集成,具體包括以下一到多項(xiàng):
?·支持ONNX模型的AI自研推理框架的開發(fā)和擴(kuò)展。
?·分析和優(yōu)化推理框架的性能,添加,維護(hù)推理相關(guān)的優(yōu)化pass(es)
?·模型混精,量化推理支持
?·針對(duì)神經(jīng)網(wǎng)絡(luò)計(jì)算設(shè)備,設(shè)計(jì)和調(diào)優(yōu)AI框架圖級(jí)別調(diào)度和融合等算法優(yōu)化;
?·跟蹤/分析/評(píng)估各主流開源深度學(xué)習(xí)框架,
?·對(duì)接Inference?server。?
職位要求:
?????計(jì)算機(jī)/電子信息類專業(yè)本科,碩士及以上學(xué)歷
?????有扎實(shí)的C/C++/Python編程能力
?????對(duì)計(jì)算機(jī)體系結(jié)構(gòu)有深刻理解
?????理解深度學(xué)習(xí)理論,熟悉Tensorflow/Caffe/Pytorch/MXNet/PaddlePaddle/oneFlow/MindSpore等至少一種開源深度學(xué)習(xí)框架
?????有較強(qiáng)的快速學(xué)習(xí)能力,良好的團(tuán)隊(duì)合作能力和溝通能力
?????流利的英語(yǔ)閱讀、寫作能力
?????(加分項(xiàng))有編譯器(LLVM/GCC),MLIR框架經(jīng)驗(yàn)
?????(加分項(xiàng))有CUDA,?TensorRT,?OpenCL或其他并行計(jì)算/HPC開發(fā)經(jīng)驗(yàn)
?????(加分項(xiàng))有XLA,TVM,ONNX,?PlaidML,?Halide,?M?ISL,?Tiramisu?and?Glow計(jì)算圖優(yōu)化經(jīng)驗(yàn)
?????(加分項(xiàng))有分布式計(jì)算框架的研發(fā)、運(yùn)維、性能評(píng)測(cè)調(diào)優(yōu)等經(jīng)驗(yàn)
?????(加分項(xiàng))有進(jìn)程,線程調(diào)度,同步,內(nèi)存搬移調(diào)優(yōu)等經(jīng)驗(yàn)
?????(加分項(xiàng))有Inference?server的對(duì)接開發(fā)經(jīng)驗(yàn):?Triton,?Nvidia?Dali,?DeepStream,?Pytorch?serving,?TensorFlow
serving?etc.
?????(加分項(xiàng))有在基于深度學(xué)習(xí)的目標(biāo)識(shí)別、目標(biāo)檢測(cè)、機(jī)器視覺、NLP領(lǐng)域有過(guò)工程經(jīng)驗(yàn)或發(fā)表過(guò)學(xué)術(shù)論文