辦公地點(diǎn):熙悅匯附近
客戶需求分析與模型選型
深入理解客戶業(yè)務(wù)場(chǎng)景與技術(shù)需求,結(jié)合NLP、CV等多領(lǐng)域知識(shí),為客戶推薦適配的語(yǔ)言大模型(如GPT、LLaMA、PaLM等)或多模態(tài)模型(如CLIP、DALL·E、Flamingo等)
制定從模型選擇、數(shù)據(jù)準(zhǔn)備到訓(xùn)練策略的全流程技術(shù)方案
模型部署與調(diào)優(yōu)
主導(dǎo)主流開(kāi)源/商用模型的本地化部署、分布式訓(xùn)練及參數(shù)優(yōu)化
設(shè)計(jì)模型微調(diào)方案(Fine-tuning/PEFT等),解決特定場(chǎng)景下的領(lǐng)域適配問(wèn)題
訓(xùn)練方案設(shè)計(jì)與實(shí)施
根據(jù)客戶計(jì)算資源與業(yè)務(wù)目標(biāo),制定包含硬件配置、訓(xùn)練框架選擇(PyTorch/TF等)、監(jiān)控方案的技術(shù)實(shí)施計(jì)劃
設(shè)計(jì)模型評(píng)估體系,確保訓(xùn)練結(jié)果達(dá)到業(yè)務(wù)指標(biāo)要求
技術(shù)賦能與知識(shí)沉淀
編寫(xiě)技術(shù)白皮書(shū)、訓(xùn)練指南等文檔,構(gòu)建可復(fù)用的行業(yè)解決方案庫(kù)
跟蹤Diffusion、MoE等前沿技術(shù)演進(jìn),推動(dòng)創(chuàng)新技術(shù)落地
任職資格要求
硬性條件:
計(jì)算機(jī)/數(shù)學(xué)相關(guān)專(zhuān)業(yè)碩士及以上學(xué)歷,3年以上AI模型實(shí)戰(zhàn)經(jīng)驗(yàn)
熟練掌握Transformer架構(gòu),具有BERT、GPT系列等大模型實(shí)戰(zhàn)調(diào)優(yōu)經(jīng)驗(yàn)
熟悉多模態(tài)模型技術(shù)棧(視覺(jué)-語(yǔ)言對(duì)齊、跨模態(tài)表示學(xué)習(xí)等)
精通PyTorch/TensorFlow框架及DeepSpeed/HuggingFace等生態(tài)工具
具備大規(guī)模分布式訓(xùn)練經(jīng)驗(yàn)(DDP/FSDP等技術(shù))
核心能力:
能快速理解客戶業(yè)務(wù)痛點(diǎn)并轉(zhuǎn)化為技術(shù)實(shí)現(xiàn)路徑
具備完整的模型訓(xùn)練全周期管理能力(從數(shù)據(jù)清洗到模型部署)
優(yōu)秀的方案呈現(xiàn)與技術(shù)溝通能力(需提供過(guò)往技術(shù)方案案例)