工作職責(zé)
1. 負(fù)責(zé)企業(yè)端 AI 架構(gòu)的規(guī)劃及實(shí)施,并引導(dǎo)研發(fā)數(shù)字化業(yè)務(wù)向智能化重構(gòu);
2. 負(fù)責(zé)推動(dòng) AI 大模型技術(shù)的產(chǎn)品化,確保產(chǎn)品質(zhì)量和功能體驗(yàn)達(dá)到用戶(hù)需求;
3. 制定 AI 大模型相關(guān)產(chǎn)品策劃,制定產(chǎn)品落地技術(shù)解決方案;
4. 開(kāi)發(fā)和維護(hù)高效、可拓展的 AI 大模型,包括但不限于語(yǔ)言大模型、圖文大模型等;
5. 搭建符合需求的 AI 大模型訓(xùn)練框架,開(kāi)展大模型的訓(xùn)練、微調(diào)、優(yōu)化、推理等工作;
6. 開(kāi)展大模型相關(guān)周邊研究,如大模型理論安全、大模型加速、大模型 Prompt 優(yōu)化等;
崗位要求:
1. 具備5年及以上計(jì)算機(jī)、深度學(xué)習(xí)和人工智能等相關(guān)專(zhuān)業(yè)工作經(jīng)驗(yàn),優(yōu)秀的代碼能力、數(shù)據(jù)結(jié)構(gòu)和基礎(chǔ)算法功底,熟練C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比賽獲獎(jiǎng)?wù)邇?yōu)先;
2. 熟悉各種模型開(kāi)發(fā)框架和工具,包括但不限于Megatron、DeepSpeed、TensorFlow、PyTorch、Caffe、MXNet、PAI等,對(duì)主流大模型(例如GPT3/chatGPT/T5/PaLM/LLaMA/GLM等)的原理、性能、差異有深入理解;
3. 出色的問(wèn)題分析和解決能力,能深入解決大模型訓(xùn)練和應(yīng)用存在的問(wèn)題;
4. 具備較強(qiáng)的PPT方案撰寫(xiě)能力、演講能力,良好的學(xué)習(xí)能力、溝通能力,較強(qiáng)的主動(dòng)性及團(tuán)隊(duì)合作精神,以及一定的抗壓能力。熟練掌握模型訓(xùn)練、微調(diào)、評(píng)估、發(fā)布、推理相關(guān)技術(shù);
5. 英語(yǔ)可作為工作語(yǔ)言。