更新于 3月3日

技術(shù)總監(jiān)

3-5萬
  • 深圳南山區(qū)
  • 科技園
  • 5-10年
  • 本科
  • 全職
  • 招1人

職位描述

Python
我們正在尋找一位具備大模型基礎(chǔ)知識(shí),并精通 C++ 和 Python 的工程師,負(fù)責(zé)大語言模型(LLM)的微調(diào)、優(yōu)化及 RAG(Retrieval-Augmented Generation)增強(qiáng)。您將參與 LoRA、量化、推理加速等優(yōu)化工作,并探索高效檢索增強(qiáng)生成(RAG)方案,提升模型在長文本理解和知識(shí)問答方面的能力。
崗位職責(zé):
負(fù)責(zé)大語言模型(LLM)的微調(diào)(Fine-tuning),包括 LoRA、全參數(shù)微調(diào)等
研究并優(yōu)化 RAG(檢索增強(qiáng)生成)方案,提升模型的上下文理解能力
優(yōu)化模型推理性能,研究并實(shí)現(xiàn)量化技術(shù)(如 GPTQ、AWQ)
結(jié)合 C++ 和 Python 進(jìn)行高效實(shí)現(xiàn),優(yōu)化訓(xùn)練和推理流程
參與向量檢索、知識(shí)庫構(gòu)建及索引優(yōu)化,如 FAISS、HNSW、Milvus 等
研究并落地高效 RAG 方案,結(jié)合分塊策略、召回排序、知識(shí)蒸餾等提升效果
結(jié)合業(yè)務(wù)需求,推進(jìn)大模型在智能問答、搜索增強(qiáng)等應(yīng)用落地
任職要求:
熟悉大模型的基礎(chǔ)知識(shí),如 Transformer、注意力機(jī)制、參數(shù)高效微調(diào)(PEFT)等
熟練掌握 C++ 和 Python,有扎實(shí)的編程能力和性能優(yōu)化經(jīng)驗(yàn)
具備模型微調(diào)(Fine-tuning)經(jīng)驗(yàn),熟悉 LoRA、Adapter、QLoRA 等技術(shù)
了解 RAG 相關(guān)技術(shù),如向量數(shù)據(jù)庫、檢索策略、知識(shí)增強(qiáng)等
熟悉 PyTorch 或 TensorFlow,并具備實(shí)際項(xiàng)目經(jīng)驗(yàn)
有模型量化(如 GPTQ、AWQ)的實(shí)踐經(jīng)驗(yàn)優(yōu)先
了解 CUDA、TensorRT、ONNX、Triton 等推理加速工具優(yōu)先
具備良好的團(tuán)隊(duì)合作和溝通能力,能夠獨(dú)立分析和解決問題
加分項(xiàng):
有開源項(xiàng)目貢獻(xiàn)或論文發(fā)表
熟悉 FlashAttention、Fused Kernel 優(yōu)化等高效計(jì)算庫
了解分布式訓(xùn)練(DeepSpeed、FSDP、Megatron-LM)
具備檢索-生成融合優(yōu)化(如 Hybrid Search、跨模態(tài)檢索)的經(jīng)驗(yàn)

工作地點(diǎn)

訊美科技廣場-2號(hào)樓1008

職位發(fā)布者

儲(chǔ)筱璇/人事經(jīng)理

三日內(nèi)活躍
立即溝通