崗位職責(zé)
1、負(fù)責(zé)大語(yǔ)言模型預(yù)訓(xùn)練算法和底層原理研究;
2、負(fù)責(zé)大語(yǔ)言模型在垂直領(lǐng)域的微調(diào)、蒸餾等方法研究與實(shí)現(xiàn);
3、負(fù)責(zé)大語(yǔ)言模型與視覺模型的結(jié)合應(yīng)用研究與實(shí)現(xiàn);
4、負(fù)責(zé)大語(yǔ)言模型與知識(shí)圖譜技術(shù)的融合研究與實(shí)現(xiàn);
5、負(fù)責(zé)大語(yǔ)言模型在具體業(yè)務(wù)場(chǎng)景中的應(yīng)用落地。
任職資格
1.計(jì)算機(jī)科學(xué)或人工智能等相關(guān)專業(yè),碩士及以上學(xué)歷;
2.NLP、大語(yǔ)言模型等研究方向,信息挖掘、知識(shí)圖譜等相關(guān)領(lǐng)域;
3.編程功底扎實(shí),熟練使用C++或Python等編程語(yǔ)言;
4.熟練使用常用的深度學(xué)習(xí)框架,如TensorFlow、PyTorch等;
5.熟悉主流大語(yǔ)言模型(GPT/T5/PaLM/LLaMA/GLM等)的原理和訓(xùn)練方法,對(duì)模型設(shè)計(jì)和適用場(chǎng)景有深入的理解;
6.熟悉大語(yǔ)言模型訓(xùn)練、微調(diào)和優(yōu)化策略,如高質(zhì)量數(shù)據(jù)清洗、模型質(zhì)量評(píng)估、Pretrain、SFT、RLHF等;
7.熟悉利用大語(yǔ)言模型進(jìn)行知識(shí)圖譜的構(gòu)建和融合;
8.熟悉利用大語(yǔ)言模型進(jìn)行業(yè)務(wù)應(yīng)用構(gòu)建的相關(guān)技術(shù),如:LangChain、向量數(shù)據(jù)庫(kù)等。
9.具有分析問題和解決問題的能力,能夠自我驅(qū)動(dòng),具有良好的團(tuán)隊(duì)合作精神,較強(qiáng)的溝通能力。
加分項(xiàng):
1.具備大模型預(yù)訓(xùn)練,文本生成,多輪對(duì)話、知識(shí)圖譜、常識(shí)推理、推薦搜索、多模態(tài)理解、信息檢索等方面實(shí)踐經(jīng)驗(yàn)者優(yōu)先。
2.有大規(guī)模分布式訓(xùn)練部署等經(jīng)驗(yàn)優(yōu)先。