1. 負(fù)責(zé)搭建和維護(hù)先進(jìn)的大數(shù)據(jù)平臺,集成和配置大數(shù)據(jù)生態(tài)系統(tǒng)中的組件,例如Apache Hadoop、Spark、Flink、Kafka、Zookeeper等,確保平臺的穩(wěn)定性、高效性和安全性;
2. 負(fù)責(zé)大數(shù)據(jù)數(shù)據(jù)業(yè)務(wù)模型研發(fā)與創(chuàng)新,深入研究并應(yīng)用大數(shù)據(jù)處理、存儲和分析技術(shù),構(gòu)建大規(guī)模結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)業(yè)務(wù)模型,并不斷優(yōu)化存儲方案以提升數(shù)據(jù)處理性能;
3. 負(fù)責(zé)數(shù)據(jù)庫架構(gòu)設(shè)計(jì),利用關(guān)系型、NewSQL、和多模型數(shù)據(jù)庫等技術(shù),進(jìn)行數(shù)據(jù)庫架構(gòu)的現(xiàn)代化設(shè)計(jì),優(yōu)化性能,解決數(shù)據(jù)庫中心建設(shè)設(shè)計(jì)問題和分布式數(shù)據(jù)庫的擴(kuò)展性和一致性問題。
4. 主導(dǎo)數(shù)據(jù)倉庫的建設(shè)工作,采用MPP架構(gòu)等多種存儲技術(shù),設(shè)計(jì)高效的數(shù)據(jù)倉庫架構(gòu)包括數(shù)據(jù)模型設(shè)計(jì)、數(shù)據(jù)集市規(guī)劃等,以滿足不同業(yè)務(wù)場景的數(shù)據(jù)應(yīng)用和分析需求;
5. 負(fù)責(zé)開發(fā)并優(yōu)化ETL、數(shù)據(jù)處理過程,設(shè)計(jì)并實(shí)現(xiàn)分布式計(jì)算任務(wù),搭建高效的數(shù)據(jù)處理分析流程,確保數(shù)據(jù)處理和分析的準(zhǔn)確性和時效性;
6. 負(fù)責(zé)數(shù)據(jù)中臺體系建設(shè)、優(yōu)化數(shù)據(jù)模型、分層等數(shù)據(jù)產(chǎn)品,確保數(shù)據(jù)質(zhì)量,對數(shù)據(jù)模型等數(shù)據(jù)項(xiàng)目進(jìn)行策略分析,提出改進(jìn)建議,推動數(shù)據(jù)治理和數(shù)據(jù)價值的最大化;
7. 關(guān)注大數(shù)據(jù)技術(shù)及人工智能的最新發(fā)展,持續(xù)學(xué)習(xí)并引入新技術(shù),提升團(tuán)隊(duì)的技術(shù)水平和創(chuàng)新能力。
任職要求:
1. 本科及以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè),3年以上經(jīng)驗(yàn);
2. 掌握hadoop和hive以及Hadoop生態(tài)系統(tǒng)及MR/Spark計(jì)算框架,能熟練使用spark、Hadoop、hive、flink
3. 掌握數(shù)大數(shù)據(jù)管理工具的使用并進(jìn)行數(shù)據(jù)處理操作及數(shù)據(jù)存儲;
4. 掌握Hue、Jupyter、Shell工具的使用,能夠編寫復(fù)雜的shell腳本;
5. 掌握SQL/HQL基本語法,能夠編寫SQL進(jìn)行數(shù)據(jù)源整理、數(shù)據(jù)清洗等;
6. 掌握python/Java/Scala/R任意一種數(shù)據(jù)分析編程語言;
7. 掌握Sqoop、DataX等命令行操作以及常用數(shù)據(jù)庫和文件系統(tǒng)間數(shù)據(jù)傳輸配置以及HDFS分布式文件系統(tǒng);
8. 工作積極主動,有良好的團(tuán)隊(duì)合作精神,能夠承受較強(qiáng)的工作壓力,接受不定期出差及駐場開發(fā);
9. 具有機(jī)器學(xué)習(xí)算法方面工作經(jīng)驗(yàn)者優(yōu)先。
蘭州 - 城關(guān)區(qū)
中電信醫(yī)療健康科技有限公司蘭州 - 七里河區(qū)
蘭州 - 城關(guān)區(qū)
蘭州 - 城關(guān)區(qū)
蘭州 - 安寧區(qū)
蘭州 - 安寧區(qū)