更新于 6月5日

數(shù)據(jù)工程師

6千-1.2萬(wàn)
  • 北京門頭溝區(qū)
  • 經(jīng)驗(yàn)不限
  • 本科
  • 全職
  • 招2人

職位描述

崗位職責(zé):

1. 熟悉搜索引擎和網(wǎng)絡(luò)爬蟲相關(guān)技術(shù),有爬蟲系統(tǒng)開發(fā)經(jīng)驗(yàn);

2. 熟練掌握網(wǎng)頁(yè)抓取原理及技術(shù),熟悉網(wǎng)頁(yè)解析過(guò)程,具備數(shù)據(jù)的過(guò)濾、清洗、去重、結(jié)構(gòu)化導(dǎo)入經(jīng)驗(yàn);

3. 熟悉分布式爬蟲應(yīng)用和調(diào)度策略,掌握各類網(wǎng)站的反爬機(jī)制和驗(yàn)證碼機(jī)制;

4. 熟悉TCP/IP協(xié)議及HTTP協(xié)議,了解基本的前端技術(shù),HTML、CSS、JS、Ajax等;

5. 熟練使用mysql,mongodb等數(shù)據(jù)庫(kù),熟悉mysql的各種存儲(chǔ)引擎,熟悉索引工作原理。


任職要求:

1. 大學(xué)本科及以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè),基礎(chǔ)扎實(shí);

2. 具有Python開發(fā)工作經(jīng)驗(yàn),熟悉Python常用函數(shù)庫(kù)和包;

3. 熟練掌握python,熟悉常用爬蟲框架中的一種或多種,熟悉Scrapy、Pyspider框架中的至少一種;

4. 熟悉MySql、Redis、MongoDB等數(shù)據(jù)庫(kù),對(duì)SQL優(yōu)化有一定的經(jīng)驗(yàn);

5.熟悉網(wǎng)頁(yè)抓取原理及技術(shù),熟練掌握正則表達(dá)式、XPath、CSS等網(wǎng)頁(yè)信息抽取技術(shù);

6.具有優(yōu)秀的團(tuán)隊(duì)合作和溝通協(xié)作能力,善于學(xué)習(xí),能承受較大的工作壓力。

工作地點(diǎn)

北京市 門頭溝區(qū) 蓮石湖西路98號(hào)院801

職位發(fā)布者

尹涓涓/人事

剛剛活躍
立即溝通
公司Logo北京邁迪培爾信息技術(shù)有限公司
北京邁迪培爾信息技術(shù)有限公司(MedPeer?)于2017年在北京市中關(guān)村門頭溝科技園成立。公司以人工智能技術(shù)為基礎(chǔ),實(shí)現(xiàn)科研資源的優(yōu)化配置為目標(biāo),“讓科研變得更容易”為導(dǎo)向,立足于提供全流程的生物醫(yī)藥科研服務(wù),幫助廣大有思路、有魄力的科研工作者都能有機(jī)會(huì)實(shí)現(xiàn)有益的探索。成立兩年來(lái),企業(yè)勵(lì)精圖治,銳意進(jìn)取,緊密圍繞科研服務(wù)這個(gè)核心,不斷完善科研全周期服務(wù)體系,打造出目前國(guó)內(nèi)領(lǐng)先的生物醫(yī)藥科研服務(wù)平臺(tái)。2018年獲評(píng)中關(guān)村高新技術(shù)企業(yè),2019年通過(guò)雙軟認(rèn)證并獲評(píng)科技型中小企業(yè),“基因-變異-疾病關(guān)系知識(shí)庫(kù)構(gòu)建系統(tǒng)”獲北京市新技術(shù)新產(chǎn)品(服務(wù))認(rèn)定。現(xiàn)擁有包括發(fā)明專利在內(nèi)的知識(shí)產(chǎn)權(quán)二十余項(xiàng),為全國(guó)30萬(wàn)科研工作者和上百家知名企業(yè)和科研院校提供專業(yè)科研服務(wù)服務(wù)。
公司主頁(yè)