更新于 今天

大數(shù)據(jù)分析師

9000-11000元

職位描述

PythonR語言JavaScalaTableau數(shù)據(jù)建模數(shù)據(jù)倉庫數(shù)據(jù)治理
技術(shù)能力

- 數(shù)據(jù)處理與存儲:熟練掌握Hadoop生態(tài)系統(tǒng),如HDFS、MapReduce、YARN等,能進行大規(guī)模數(shù)據(jù)的存儲和處理。熟悉HBase、Cassandra等NoSQL數(shù)據(jù)庫,以及Hive等數(shù)據(jù)倉庫工具。

- 數(shù)據(jù)挖掘與分析:掌握數(shù)據(jù)挖掘算法,如聚類、分類、回歸等,能運用Mahout等工具進行數(shù)據(jù)挖掘。熟練使用Python或R語言進行數(shù)據(jù)分析和可視化,有數(shù)據(jù)探索、特征工程等經(jīng)驗。

- 編程與開發(fā):精通Java、Scala、Python等編程語言,有良好的面向?qū)ο缶幊毯秃瘮?shù)式編程能力。熟悉Spark、Flink等大數(shù)據(jù)處理框架,能開發(fā)數(shù)據(jù)處理和分析的應(yīng)用程序。

- 數(shù)據(jù)可視化:能使用Tableau、PowerBI等工具進行數(shù)據(jù)可視化,將復(fù)雜數(shù)據(jù)以直觀易懂的圖表呈現(xiàn)。了解D3.js等前端可視化庫,可進行定制化可視化開發(fā)。

問題解決能力

- 數(shù)據(jù)質(zhì)量:能識別和處理數(shù)據(jù)中的噪聲、缺失值、異常值等問題,保證數(shù)據(jù)質(zhì)量。建立數(shù)據(jù)質(zhì)量評估體系,制定數(shù)據(jù)清洗和預(yù)處理策略。

- 性能優(yōu)化:對大數(shù)據(jù)處理系統(tǒng)進行性能調(diào)優(yōu),如優(yōu)化Spark作業(yè)參數(shù)、調(diào)整Hadoop集群資源配置。通過數(shù)據(jù)分區(qū)、索引等技術(shù)提高數(shù)據(jù)查詢和處理效率。

業(yè)務(wù)理解能力

- 行業(yè)知識:了解所在行業(yè)的業(yè)務(wù)流程和需求,如在金融領(lǐng)域,要懂風(fēng)險評估、交易流程等。能將業(yè)務(wù)問題轉(zhuǎn)化為數(shù)據(jù)問題,用數(shù)據(jù)驅(qū)動業(yè)務(wù)決策。

- 溝通協(xié)作:與業(yè)務(wù)部門、數(shù)據(jù)分析師、算法工程師等團隊成員有效溝通,理解需求并提供數(shù)據(jù)支持。在跨部門項目中,能協(xié)作完成數(shù)據(jù)相關(guān)的任務(wù)和目標。

學(xué)習(xí)創(chuàng)新能力

- 技術(shù)學(xué)習(xí):關(guān)注大數(shù)據(jù)領(lǐng)域的新技術(shù)、新框架,如分布式存儲、流計算等,不斷學(xué)習(xí)和應(yīng)用。能快速掌握和運用新的數(shù)據(jù)處理和分析工具。

- 創(chuàng)新應(yīng)用:能創(chuàng)新地運用大數(shù)據(jù)技術(shù)解決實際問題,提出新的數(shù)據(jù)分析思路和方法。探索利用新興技術(shù)如人工智能與大數(shù)據(jù)結(jié)合,創(chuàng)造新的業(yè)務(wù)價值。

工作地點

新疆維吾爾自治區(qū)烏魯木齊市沙依巴克區(qū)經(jīng)濟技術(shù)開發(fā)區(qū)頭屯河區(qū)喀納斯湖北路455號軟件園

職位發(fā)布者

張紅娟/運營總監(jiān)

今日活躍
立即溝通