崗位職責(zé):
1. 熟悉搜索引擎和網(wǎng)絡(luò)爬蟲相關(guān)技術(shù),有爬蟲系統(tǒng)開發(fā)經(jīng)驗(yàn);
2. 熟練掌握網(wǎng)頁抓取原理及技術(shù),熟悉網(wǎng)頁解析過程,具備數(shù)據(jù)的過濾、清洗、去重、結(jié)構(gòu)化導(dǎo)入經(jīng)驗(yàn);
3. 熟悉分布式爬蟲應(yīng)用和調(diào)度策略,掌握各類網(wǎng)站的反爬機(jī)制和驗(yàn)證碼機(jī)制;
4. 熟悉TCP/IP協(xié)議及HTTP協(xié)議,了解基本的前端技術(shù),HTML、CSS、JS、Ajax等;
5. 熟練使用mysql,mongodb等數(shù)據(jù)庫,熟悉mysql的各種存儲引擎,熟悉索引工作原理。
任職要求:
1. 大學(xué)本科及以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè),基礎(chǔ)扎實(shí);
2. 具有Python開發(fā)工作經(jīng)驗(yàn),熟悉Python常用函數(shù)庫和包;
3. 熟練掌握python,熟悉常用爬蟲框架中的一種或多種,熟悉Scrapy、Pyspider框架中的至少一種;
4. 熟悉MySql、Redis、MongoDB等數(shù)據(jù)庫,對SQL優(yōu)化有一定的經(jīng)驗(yàn);
5.熟悉網(wǎng)頁抓取原理及技術(shù),熟練掌握正則表達(dá)式、XPath、CSS等網(wǎng)頁信息抽取技術(shù);
6.具有優(yōu)秀的團(tuán)隊(duì)合作和溝通協(xié)作能力,善于學(xué)習(xí),能承受較大的工作壓力。
公司介紹:
北京邁迪培爾信息技術(shù)有限公司(MedPeerTM)坐落于風(fēng)景秀麗的京西中關(guān)村門頭溝科技園,是一家專注于生物醫(yī)學(xué)教育與科研服務(wù)的創(chuàng)新型公司,公司創(chuàng)始人涵蓋國內(nèi)著名院校、科研機(jī)構(gòu)、臨床醫(yī)院和投資公司的業(yè)務(wù)精英,具有極其豐富的教育與科研服務(wù)實(shí)踐經(jīng)驗(yàn),以及廣泛的業(yè)務(wù)領(lǐng)域平臺和人脈資源。公司率先在國內(nèi)提出“融合型人工智能”概念,將“人工智能”、“大數(shù)據(jù)分析”和生物醫(yī)學(xué)科研教育有機(jī)融合,致力于創(chuàng)建新型科技創(chuàng)新模式,促進(jìn)生物醫(yī)學(xué)技術(shù)研發(fā)平臺整體躍升。
北京 - 海淀
北京智悅信息科技有限公司北京 - 豐臺
北京 - 昌平
北京 - 朝陽
北京 - 石景山
北京 - 豐臺
北京星宇辰科技有限公司