崗位職責
1、負責神經(jīng)網(wǎng)絡模型的輕量化技術研究與應用(包括但不限于量化、剪枝、知識蒸餾、網(wǎng)絡結構搜索等),提升模型在資源受限設備上的運行效率
2、針對業(yè)務需求設計并實現(xiàn)高效的模型壓縮算法,平衡模型精度、計算量、內(nèi)存占用等指標
3、與硬件團隊協(xié)作,針對芯片特性(如緩存、內(nèi)存帶寬、并行計算單元)設計高效推理方案
4、輸出標準化部署工具鏈或自動化流程,提升團隊效率。
崗位要求
1、計算機科學、電子工程、自動化、人工智能相關專業(yè)碩士及以上學歷,3年以上算法工程化經(jīng)驗
2、熟練掌握PyTorch或TensorFlow等框架,深入理解模型壓縮技術原理(如量化校準、稀疏訓練、通道剪枝)
3、具備嵌入式或安卓或IOS開發(fā)經(jīng)驗,熟悉C/C++、交叉編譯工具鏈,能獨立完成常見的單片機/NPU或IOS、安卓上的模型部署與調(diào)試。
4、熟悉常見端側推理框架(如TFLite、ONNX Runtime、TVM、SNPE)及模型格式轉換工具(如NNEF、OpenVINO)
加分項
1、有過至少1個完整端側模型部署項目(如CV/NLP模型在STM32/NPU芯片的落地、安卓、IOS機等),熟悉模型從訓練到部署的全鏈路問題
2、有MCU(如STM32、ESP32)或邊緣芯片(如瑞芯微、地平線、Hailo)部署經(jīng)驗,熟悉其SDK及硬件加速庫。
3、熟悉編譯原理,了解MLIR/LLVM或自動代碼生成工具(如Halide、AutoKernel)。
4、熟悉芯片底層優(yōu)化技術(如ARM NEON指令集、NPU指令調(diào)度、內(nèi)存對齊優(yōu)化),有性能分析工具(如Perf、Trace32)使用經(jīng)驗
深圳 - 龍崗
深圳 - 龍崗
深圳 - 光明
深圳 - 龍崗
深圳 - 寶安
深圳 - 光明