工作內容
1、負責公司GPU設備的日常維護和保養(yǎng),保障算力輸出的持續(xù)、穩(wěn)定、高效;
2、對設備硬件進行維護,包括設備上下架,設備開關機,RAID配置,網(wǎng)口或者線纜維護等;
3、實時操作系統(tǒng)安裝及網(wǎng)絡基礎配置,基本操作系統(tǒng)和網(wǎng)絡故障排查;包括配置網(wǎng)卡、管理卡IP,修改系統(tǒng)密碼,系統(tǒng)服務開啟/關閉/重啟等;
4、實施相關設備的資產(chǎn)管理工作,包括資產(chǎn)盤點、統(tǒng)計、貼簽等;
5、實施各模塊機房和網(wǎng)絡機房相關設備的定期巡檢,對異常按要求時間進行通報;
6、實施數(shù)據(jù)中心相關業(yè)務開通,設備遷入遷出,現(xiàn)場代為操作等工單任務;
7、協(xié)助客戶綜合布線或者其他服務請求等工單任務;
8、協(xié)助處理故障和制作客戶故障報告;
9、配合帶領客戶和領導進行參觀訪問;
10、完成其他領導交辦的工作。
任職要求
1、本科以上學歷,計算機或相關專業(yè)畢業(yè),一年以上工作經(jīng)驗;
2、熟悉Windows、Linux操作系統(tǒng)的安裝、配置、故障排除,具備各類系統(tǒng)環(huán)境,如雙機群、冷熱備等管理模式的部署,優(yōu)化配置能力;
3、有扎實的服務器硬件知識,熟悉不同服務器型號和品牌,能夠進行服務器的安裝、配置和維護,包括硬件組件的更換和升級;
4、具備GPU計算卡經(jīng)驗,熟悉主流的GPU計算卡型號和架構,能夠安裝、配置和管理GPU計算卡,并進行性能優(yōu)化和故障排除;
5、熟悉服務器硬件的性能監(jiān)測和調優(yōu)工具,能夠進行性能分析和瓶頸識別;
6、熟悉服務器虛擬化技術,如VMware、KVM等優(yōu)先考慮;
7、具備深入了解GPU計算框架,如CUDA、OpenCL等優(yōu)先考慮。