崗位職責:
1.負責開發(fā)和優(yōu)化NLP的相關(guān)算法,確保技術(shù)實現(xiàn)符合項目需求。
2. 理解業(yè)務(wù)需求,參與算法功能設(shè)計及架構(gòu)設(shè)計,參與算法的測試流程,與團隊確保算法的質(zhì)量和行能。
3. 知識庫文檔分塊:選擇與制定擇合適的分塊方法(智能切分、多級切分等),處理含表格和圖像的文檔,定義 chunk_size 和 chunk_overlap。
4..建立質(zhì)量評估指標(如語義完整性評分),定期檢查并優(yōu)化算法,確保內(nèi)容完整性和一致性。
5.根據(jù)業(yè)務(wù)場景定義數(shù)據(jù)需求,設(shè)計標注規(guī)則文檔,確保標注一致性。提取并清洗原始文本數(shù)據(jù),進行OCR識別與版面分析,提取結(jié)構(gòu)化文本。組織團隊完成實體標注、意圖分類等任務(wù),使用標注工具管理流程,并實施數(shù)據(jù)增強策略。設(shè)計校驗?zāi)_本檢測標注錯誤,生成數(shù)據(jù)集說明文檔,包含統(tǒng)計指標和樣本示例。
任職要求:
1.本科及以上學(xué)歷,擁有計算機、人工智能、數(shù)學(xué)、統(tǒng)計學(xué)的相關(guān)專業(yè),熟悉常見的算法和數(shù)據(jù)結(jié)構(gòu),具備較強的算法能力;
2.具備2年以上相關(guān)開發(fā)經(jīng)驗;
3.熟悉NLP算法的工具和框架,實現(xiàn)相關(guān)的算法實現(xiàn)和優(yōu)化;
4.具備良好的溝通能力、協(xié)調(diào)和團隊和合作能力,較強的解決問題能力和創(chuàng)新思維;
北京 - 海淀
北京 - 朝陽
三星(中國)投資有限公司北京 - 朝陽
北京 - 豐臺
北京 - 順義
北京四方上行軟件技術(shù)有限公司北京 - 豐臺