職位描述:
1、基座大模型訓練算法設計,對現(xiàn)有框架進行優(yōu)化,改進訓練效率;
2、設計預開發(fā)大模型新一代網(wǎng)絡結(jié)構(gòu),改進長文、幻覺、記憶等能力;
3、進行大模型對齊研究,改進現(xiàn)有偏好學習算法與網(wǎng)絡結(jié)構(gòu);
任職資格:
1、具備較好的機器學習和數(shù)學基礎,專業(yè)不限;
2、具有分布式模型訓練實踐基礎,具有較強的動手能力和工具開發(fā)經(jīng)驗;
3、具備較強的問題分析能力、責任感和合作意識
以下優(yōu)先:
1、具有編程競賽獲獎或者優(yōu)秀開源項目經(jīng)驗優(yōu)先;
2、在NLP/AI頂會發(fā)表論文,例如ACL/ICML/NeurLPS/ICLR等;
3、具有大模型加速算法開發(fā)經(jīng)驗優(yōu)先
杭州 - 西湖
杭州 - 余杭
杭州 - 西湖
浙江紫曦數(shù)字科技有限公司杭州 - 西湖
杭州 - 余杭
杭州 - 濱江