崗位職責(zé):
1、負(fù)責(zé)使用現(xiàn)有的開源大模型(如Hugging Face系列模型),根據(jù)指定行業(yè)等業(yè)務(wù)場景和需求進(jìn)行針對性的訓(xùn)練和微調(diào),以提高模型在特定任務(wù)上的性能和準(zhǔn)確性。
2、熟練運(yùn)用向量數(shù)據(jù)庫(如Milvus、Faiss),構(gòu)建高效的推薦系統(tǒng)或搜索引擎,實(shí)現(xiàn)大規(guī)模數(shù)據(jù)的快速檢索和匹配。
3、收集、整理和標(biāo)注百萬級規(guī)模的訓(xùn)練數(shù)據(jù)以及向量數(shù)據(jù),確保數(shù)據(jù)的質(zhì)量和一致性,為模型訓(xùn)練和微調(diào)提供高質(zhì)量的數(shù)據(jù)支持。
4、使用 Python 編寫數(shù)據(jù)處理腳本、模型訓(xùn)練和評估代碼、與向量數(shù)據(jù)庫交互的接口等,并對代碼進(jìn)行定期維護(hù)和優(yōu)化,確保代碼的可擴(kuò)展性和可維護(hù)性。
5、持續(xù)監(jiān)測模型在實(shí)際應(yīng)用中的性能表現(xiàn)(如準(zhǔn)確率、召回率、延遲等),及時(shí)發(fā)現(xiàn)問題并進(jìn)行優(yōu)化調(diào)整(如模型壓縮、量化等),確保模型的穩(wěn)定性和可靠性。
6、與跨部門團(tuán)隊(duì)緊密合作,理解業(yè)務(wù)需求并提供技術(shù)解決方案,同時(shí)分享技術(shù)知識和經(jīng)驗(yàn),促進(jìn)團(tuán)隊(duì)整體技術(shù)水平的提升。
任職要求:
專業(yè)背景:計(jì)算機(jī)科學(xué)、人工智能、機(jī)器學(xué)習(xí)等相關(guān)專業(yè)本科及以上學(xué)歷。
技術(shù)技能:
1、精通 Python 編程,有扎實(shí)的編程基礎(chǔ)和良好的代碼規(guī)范,熟悉C++或Java者優(yōu)先。
2、熟悉常見的開源大模型(如BERT、GPT、DEEPSEEK等),有實(shí)際訓(xùn)練和微調(diào)這些模型的經(jīng)驗(yàn)。
3、熟練掌握向量數(shù)據(jù)庫的使用(如Milvus、Faiss等),了解向量檢索和存儲的原理,具備數(shù)據(jù)庫優(yōu)化經(jīng)驗(yàn)者優(yōu)先。
4、熟悉數(shù)據(jù)處理和標(biāo)注的流程和方法,有處理大規(guī)模數(shù)據(jù)集的經(jīng)驗(yàn)。
5、了解深度學(xué)習(xí)框架(如PyTorch、TensorFlow等),具備分布式訓(xùn)練或模型部署經(jīng)驗(yàn)者優(yōu)先。
項(xiàng)目經(jīng)驗(yàn):具有至少2個與大模型應(yīng)用相關(guān)的項(xiàng)目經(jīng)驗(yàn),能夠展示在模型訓(xùn)練、微調(diào)以及與向量數(shù)據(jù)庫結(jié)合方面的實(shí)際成果,項(xiàng)目規(guī)模需達(dá)到百萬級數(shù)據(jù)量。