崗位職責(zé)
1、負(fù)責(zé)大語言模型預(yù)訓(xùn)練算法和底層原理研究;
2、負(fù)責(zé)大語言模型在垂直領(lǐng)域的微調(diào)、蒸餾等方法研究與實現(xiàn);
3、負(fù)責(zé)大語言模型與視覺模型的結(jié)合應(yīng)用研究與實現(xiàn);
4、負(fù)責(zé)大語言模型與知識圖譜技術(shù)的融合研究與實現(xiàn);
5、負(fù)責(zé)大語言模型在具體業(yè)務(wù)場景中的應(yīng)用落地。
任職資格
1.計算機(jī)科學(xué)或人工智能等相關(guān)專業(yè),碩士及以上學(xué)歷;
2.NLP、大語言模型等研究方向,信息挖掘、知識圖譜等相關(guān)領(lǐng)域;
3.編程功底扎實,熟練使用C++或Python等編程語言;
4.熟練使用常用的深度學(xué)習(xí)框架,如TensorFlow、PyTorch等;
5.熟悉主流大語言模型(GPT/T5/PaLM/LLaMA/GLM等)的原理和訓(xùn)練方法,對模型設(shè)計和適用場景有深入的理解;
6.熟悉大語言模型訓(xùn)練、微調(diào)和優(yōu)化策略,如高質(zhì)量數(shù)據(jù)清洗、模型質(zhì)量評估、Pretrain、SFT、RLHF等;
7.熟悉利用大語言模型進(jìn)行知識圖譜的構(gòu)建和融合;
8.熟悉利用大語言模型進(jìn)行業(yè)務(wù)應(yīng)用構(gòu)建的相關(guān)技術(shù),如:LangChain、向量數(shù)據(jù)庫等。
9.具有分析問題和解決問題的能力,能夠自我驅(qū)動,具有良好的團(tuán)隊合作精神,較強(qiáng)的溝通能力。
加分項:
1.具備大模型預(yù)訓(xùn)練,文本生成,多輪對話、知識圖譜、常識推理、推薦搜索、多模態(tài)理解、信息檢索等方面實踐經(jīng)驗者優(yōu)先。
2.有大規(guī)模分布式訓(xùn)練部署等經(jīng)驗優(yōu)先。