更新于 12月4日

大模型工程師

1.5-3萬(wàn)·15薪
  • 北京朝陽(yáng)區(qū)
  • 5-10年
  • 本科
  • 全職
  • 招1人

職位描述

PythonPyTorchTensorFlowMEGATRONDEEPSPEEDDEEPSPEED-CHATLoRaGPTP-TUNING
崗位職責(zé):
1.負(fù)責(zé)預(yù)訓(xùn)練大模型的工程化落地,探索業(yè)界領(lǐng)先的大模型框架;
2.圍繞AI大模型領(lǐng)域,構(gòu)建從數(shù)據(jù)采集、加工標(biāo)注、算法訓(xùn)練部署、推理的數(shù)據(jù)算法流閉環(huán);
3.負(fù)責(zé)大模型的結(jié)構(gòu)設(shè)計(jì)、訓(xùn)練、微調(diào)、部署和優(yōu)化,提高模型的效率、穩(wěn)定性和可擴(kuò)展性,推動(dòng)大模型在邊端側(cè)的應(yīng)用;
4.跟蹤國(guó)內(nèi)外前沿的大模型技術(shù)動(dòng)態(tài),持續(xù)改進(jìn)和優(yōu)化現(xiàn)有模型;
崗位需求:
1.本科及以上學(xué)歷,計(jì)算機(jī)相關(guān)背景,3-5年工作經(jīng)驗(yàn);
2.精通Python、C/C++、Go等編程語(yǔ)言,熟練掌握PyTorch或TensorFlow等主流深度學(xué)習(xí)框架;
3.熟悉大模型分布式訓(xùn)練技術(shù)和框架庫(kù),如Megatron、DeepSpeed、Deepspeed-Chat等,熟悉框架庫(kù)源碼,有千卡以上集群的大模型訓(xùn)練經(jīng)驗(yàn);
4.精通大模型推理優(yōu)化技術(shù)、模型壓縮技術(shù),如量化、剪枝和蒸餾等,精通各種微調(diào)技術(shù),如LoRA、p-tuning、SFT、RLHF等;
5.有GPT類(lèi)大模型優(yōu)化及工程應(yīng)用實(shí)踐經(jīng)驗(yàn)優(yōu)先。

工作地點(diǎn)

啟明國(guó)際大廈

職位發(fā)布者

李墨/人事經(jīng)理

立即溝通
公司Logo北京數(shù)道智算科技有限公司
北京數(shù)道智算科技有限公司作為一家提供智能算力服務(wù)的企業(yè),成立于2023年9月21日,注冊(cè)資金13684.2105萬(wàn)元人民幣,由廣東中關(guān)村協(xié)同智算股權(quán)投資合伙企業(yè)(有限合伙)、摩爾線程智能科技(北京)有限責(zé)任公司、北京智譜華章科技有限公司等共同持股組建。公司致力于以算力基礎(chǔ)設(shè)施需求為驅(qū)動(dòng),為上下游企業(yè)技術(shù)與應(yīng)用創(chuàng)新賦能,助推區(qū)域產(chǎn)業(yè)轉(zhuǎn)型升級(jí)。業(yè)務(wù)涵蓋算力建設(shè)、算力平臺(tái)研發(fā)和全棧算力服務(wù)。為AI、元宇宙、數(shù)字仿真等新興數(shù)字經(jīng)濟(jì)的企業(yè)提供全方位的算力支撐。
公司主頁(yè)