崗位職責(zé):
1. 參與基于深度學(xué)習(xí)和大語言模型(如 Transformer、GPT、BERT 等)的算法開發(fā)、優(yōu)化及部署;
2. 負(fù)責(zé)大語言模型的微調(diào)、優(yōu)化、推理加速及部署
3. 研究并實(shí)現(xiàn)前沿的自然語言處理(NLP)技術(shù),提升模型在文本生成、語義理解、問答系統(tǒng)等任務(wù)上的表現(xiàn);
4. 參與大模型訓(xùn)練數(shù)據(jù)的清洗、整理和增強(qiáng),提升模型的泛化能力和魯棒性;
5. 設(shè)計(jì)并優(yōu)化模型評(píng)估方法,提升訓(xùn)練和推理效率,降低計(jì)算資源消耗;
6. 參與相關(guān)應(yīng)用系統(tǒng)的開發(fā),包括 API 接口封裝、模型服務(wù)化、工程部署等;
7. 關(guān)注前沿 AI 研究成果,分析行業(yè)趨勢(shì),并推動(dòng)新技術(shù)的落地和應(yīng)用;
8. 配合產(chǎn)品團(tuán)隊(duì),支持基于大模型的智能應(yīng)用(如智能助手、自動(dòng)摘要、代碼生成等)的開發(fā)與優(yōu)化。
任職要求:
1. 計(jì)算機(jī)、人工智能、數(shù)學(xué)、統(tǒng)計(jì)學(xué)或相關(guān)專業(yè),碩士及以上學(xué)歷(優(yōu)秀者可放寬至本科);
2. 熟悉深度學(xué)習(xí)框架(如 TensorFlow、PyTorch),具有大規(guī)模模型訓(xùn)練和優(yōu)化經(jīng)驗(yàn);
3. 熟悉 Transformer 結(jié)構(gòu),掌握主流大語言模型(如 GPT、LLaMA、T5、Mistral)的架構(gòu)及訓(xùn)練方法;
4. 具備扎實(shí)的 Python 編程能力,熟悉 C++/CUDA 者優(yōu)先;
5. 具備 NLP 相關(guān)任務(wù)(如文本分類、文本生成、知識(shí)圖譜等)的實(shí)戰(zhàn)經(jīng)驗(yàn);
6. 具備良好的數(shù)學(xué)基礎(chǔ),熟悉優(yōu)化算法、概率統(tǒng)計(jì)、信息論等相關(guān)知識(shí);
7. 具備較強(qiáng)的團(tuán)隊(duì)合作能力、學(xué)習(xí)能力和問題解決能力,能夠快速適應(yīng)新技術(shù);
8. 發(fā)表過相關(guān)學(xué)術(shù)論文(如 NeurIPS、ICLR、ACL、CVPR)或有開源項(xiàng)目經(jīng)驗(yàn)者加分。
9. 對(duì)機(jī)器數(shù)據(jù)模型有了解者加分(如Yolo,ResNet等)。
加分項(xiàng):
1. 有大模型 LoRA、QLoRA、MoE 相關(guān)經(jīng)驗(yàn);
2. 具備模型蒸餾、剪枝、量化等模型優(yōu)化經(jīng)驗(yàn);
3. 熟悉 AI 推理加速(如 TensorRT、ONNX Runtime)或高性能計(jì)算(HPC);
4. 熟悉云端 AI 訓(xùn)練與推理環(huán)境(如 Hugging Face、DeepSpeed、ColossalAI)。