1、模型微調(diào)與優(yōu)化:參與大模型在協(xié)同辦公及建筑行業(yè)場景下的應(yīng)用,包括但不限于:基于公有云大模型做局部私有資料的對接微調(diào),基于私有大模型做垂直領(lǐng)域的數(shù)據(jù)抓取、自動標(biāo)注、微調(diào)訓(xùn)練;
2、應(yīng)用落地:負(fù)責(zé)大模型的模型適配與應(yīng)用落地,包括但不限于LLM、Langchain、Agent、Eval等技術(shù);
3、性能評估監(jiān)測與部署:定期監(jiān)控模型性能,進行在特定應(yīng)用場景下的各類模型能力的評估,確保模型達到業(yè)務(wù)要求,能夠進行模型的容器化部署。
任職要求:
1、參與過大模型相關(guān)開發(fā)工作,包括但不限于:數(shù)據(jù)清洗、開源模型實際微調(diào)、訓(xùn)練框架開發(fā)、評測、推理部署等;
2、精通Python編程語言,熟悉Java等其他編程語言,熟悉常用框架如PyTorch,TensorFlow等深度學(xué)習(xí)框架;
3、熟悉大語言模型的增量預(yù)訓(xùn)練、指令微調(diào)、偏好微調(diào)等多種訓(xùn)練方法 ,有全場景訓(xùn)練實戰(zhàn)落地經(jīng)驗;
4、熟悉全參數(shù)、LoRA 、QLoRA 等微調(diào)方法, 有微調(diào)場景落地經(jīng)驗;
5、熟悉DeepSpeed、flash-attn、vllm等大模型訓(xùn)練及推理加速方法;
6、熟悉數(shù)據(jù)收集、清洗和預(yù)處理的流程。有訓(xùn)練數(shù)據(jù)構(gòu)造落地經(jīng)驗;
7、熟悉Docker、Kubernetes等容器化技術(shù)。
8、扎實的數(shù)學(xué)功底,熟悉概率統(tǒng)計、線性代數(shù)、優(yōu)化方法等領(lǐng)域的相關(guān)知識 。
9、有成功優(yōu)化模型訓(xùn)練算法、提升模型性能的項目經(jīng)驗,能夠獨立承擔(dān)算法設(shè)計和開發(fā)任務(wù),能獨當(dāng)一面。
10、對深度學(xué)習(xí)領(lǐng)域的技術(shù)創(chuàng)新有敏銳的洞察力,樂于學(xué)習(xí)并積極探索新技術(shù) 。
南昌 - 南昌縣
南昌 - 紅谷灘
南昌 - 南昌縣
南昌 - 紅谷灘
南昌 - 南昌縣
南昌 - 東湖
江西金融發(fā)展集團股份有限公司