崗位職責:?1、負責大模型的探索規(guī)劃,包括技術(shù)研究、戰(zhàn)略規(guī)劃、方案設(shè)計等;
?2、負責大模型的行業(yè)信息調(diào)研、客戶需求分析對接,以完成模型自進化為目標設(shè)計整體架構(gòu),對自有方案和產(chǎn)品提出相應(yīng)改進建議;
?3、負責大模型開發(fā)的全流程管理,包括相關(guān)屬性評測、海量訓練數(shù)據(jù)準備、產(chǎn)品化部署落地及項目成本控制等;
?4、結(jié)合業(yè)務(wù)領(lǐng)域真實問題,研究學習業(yè)內(nèi)領(lǐng)先思路,協(xié)助構(gòu)建行業(yè)領(lǐng)先的多模態(tài)核心能力。???
?
???任職資格:?
???1、計算機科學、人工智能、機器學習或相關(guān)領(lǐng)域,碩士及以上學歷;?
???2、具備優(yōu)秀的編程能力和經(jīng)驗,具有扎實的數(shù)據(jù)結(jié)構(gòu)和算法功底;?
???3、精通TensorFlow、PyTorch、DeepSpeed、Megatron、ColossalAI等深度學習框架,大模型訓練、調(diào)優(yōu)經(jīng)驗;熟悉常見技術(shù)如SFT,P-tuning,?LoRA等;?
???4、閱讀過Transformers源碼,熟悉底層原理,熟悉FlashAttention等框架;?
???加分項:?
???有較強的的中大型項目或個人開源項目經(jīng)驗;?
???有較強的鉆研精神和自驅(qū)力。