更新于 3月24日

中高級python爬蟲工程師

2-3萬
  • 北京石景山區(qū)
  • 5-10年
  • 本科
  • 全職
  • 招2人

職位描述

Python反爬蟲分布式爬蟲ScrapyJS DEBUGGERJS 逆向SeleniumDRISSIONPAGEAPP脫殼APP逆向反編譯
崗位職責(zé):
1.對指定的網(wǎng)站進(jìn)行網(wǎng)頁抓取、數(shù)據(jù)提取、破解反爬策略;
2.負(fù)責(zé)多平臺信息抽取、數(shù)據(jù)清洗、入庫、服務(wù)化等研發(fā)和優(yōu)化工作;
3.參與開發(fā)和設(shè)計分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進(jìn)行信息的抓取和分析工作;
4.研究優(yōu)化爬蟲算法,提升爬蟲系統(tǒng)的穩(wěn)定性、可擴展性;
5.獨立解決實際開發(fā)過程中碰到的各類產(chǎn)品數(shù)據(jù)需求和接口問題。
任職資格:
1、本科及以上學(xué)歷,計算機相關(guān)專業(yè),5年以上工作經(jīng)驗。
2、精通python編程語言,熟悉scrapy等常用數(shù)據(jù)抓取框架以及原理,熟悉網(wǎng)頁信息和APP數(shù)據(jù)抽取,能夠設(shè)計分布式爬蟲系統(tǒng)框架;
3、精通 Charles等抓包工具,精通網(wǎng)頁抓取原理及技術(shù),精通正則表達(dá)式,熟練從結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)中獲取信息;
4、精通 JS debugger、JS逆向;
5、精通 selenium 、DrissionPage 等自動化抓取技術(shù);
6、把握網(wǎng)絡(luò)爬蟲核心技術(shù)研究方向,研究優(yōu)化算法,提升爬蟲系統(tǒng)的穩(wěn)定性、可擴展性;
7、研究爬蟲策略和防屏蔽規(guī)則,解決封賬號、封IP、驗證碼、頁面跳轉(zhuǎn)等難點攻克,提升網(wǎng)頁抓取的效率和質(zhì)量
8、優(yōu)先條件,對APP脫殼、APP逆向反編譯或者有快手、抖音數(shù)據(jù)爬取經(jīng)驗,或者對機器學(xué)習(xí)算法有一定了解。

工作地點

六工匯-F1號樓

職位發(fā)布者

高健/HR

當(dāng)前在線
立即溝通
北京大享科技有限公司
北京大享科技有限公司是一家從事技術(shù)開發(fā),技術(shù)推廣,技術(shù)轉(zhuǎn)讓等業(yè)務(wù)的公司,成立于2018年03月26日,公司坐落在北京市,企業(yè)的經(jīng)營范圍為:技術(shù)開發(fā)、技術(shù)推廣、技術(shù)轉(zhuǎn)讓、技術(shù)咨詢、技術(shù)服務(wù);計算機系統(tǒng)服務(wù);基礎(chǔ)軟件服務(wù)、應(yīng)用軟件服務(wù);軟件開發(fā);軟件咨詢;產(chǎn)品設(shè)計;數(shù)據(jù)處理,公司致力于為企業(yè)提供先進(jìn)的解決方案和技術(shù)服務(wù)。
公司主頁