一、職位描述:
1、負(fù)責(zé)設(shè)計(jì)和開發(fā)分布式的網(wǎng)絡(luò)爬蟲應(yīng)用,包括調(diào)度、抓取、入庫等內(nèi)容,進(jìn)行互聯(lián)網(wǎng)相關(guān)信息的抓取和分析
2、負(fù)責(zé)實(shí)現(xiàn)大規(guī)模數(shù)據(jù)的抓取、抽取,去重、分類,垃圾過濾,質(zhì)量識(shí)別、解析入庫等工作
3、負(fù)責(zé)對(duì)指定的多個(gè)網(wǎng)站進(jìn)行網(wǎng)頁抓取、數(shù)據(jù)提取、破解反爬策略
4、承接開發(fā)任務(wù),需求分析,確保按時(shí)按質(zhì)按量完成任務(wù)
5、有良好的溝通和學(xué)習(xí)能力.有較強(qiáng)的團(tuán)隊(duì)協(xié)作能力以及快速解決問題的能力。
二、崗位要求:
1、計(jì)算機(jī)或相關(guān)專業(yè)、具備3年以上項(xiàng)目開發(fā)經(jīng)驗(yàn);
2、具有scrapy, scrapy-redis開發(fā)經(jīng)驗(yàn);
3、具有web逆向經(jīng)驗(yàn), 如滑塊驗(yàn)證碼, 瑞數(shù)5代6代
4、熟悉多線程、網(wǎng)絡(luò)編程,精通網(wǎng)頁抓取原理及技術(shù),精通正則表達(dá)式;?
5、熟悉并熟練應(yīng)用各種常見加密算法;?
6、熟悉至少一種關(guān)系型數(shù)據(jù)庫(MySQL等); 熟悉NoSQL redis mongodb;至少熟悉一種mq, 有過數(shù)據(jù)庫調(diào)優(yōu)和海量數(shù)據(jù)存儲(chǔ)經(jīng)驗(yàn)優(yōu)先;
7、具有工商數(shù)據(jù)、金融數(shù)據(jù)、案件數(shù)據(jù)抓取經(jīng)驗(yàn)者優(yōu)先;?
8、有移動(dòng)平臺(tái)(iOS,安卓)開發(fā)經(jīng)驗(yàn)優(yōu)先;
?