大數據架構師的基本職責(精選16篇)
大數據架構師的基本職責 篇1
職責:
1.負責整個大數據平臺架構的設計和構建;
2.負責構建大數據平臺的數據交換、任務調度等通用平臺;
3.制定開發、測試、實施、維護的標準和規范,指導和培訓工程師,不斷提升團隊能力。
4.參與系統需求分析、架構設計、技術選型、應用設計與開發以及測試與部署,負責編寫核心部分代碼。
5.持續挑戰新的技術方向,攻克大數據量、高并發、高可用、可擴展等技術難點。
任職要求:
1.3年以上大數據架構經驗,豐富的數據倉庫、數據挖掘、機器學習項目經驗
2.大規模數據處理的架構和設計實戰經驗
3.精通Spark、MR,熟練HDFS、Yarn、Hbase、Hive、MongoDB,熟悉Kafka、Redis、Storm、Mahout、Flume、ElasticSearch、GraphDB(NEO4J或其他)等,并具有豐富的大型數據平臺工程經驗
4.深刻理解大數據處理(流計算,分布式計算,分布式文件系統,分布式存儲等)相關技術和實現方法
5.熟悉主數據、元數據、數據質量等企業數據管理相關的體系和方法,熟練Linux/Unix平臺上的開發環境
6.本科或以上學歷,計算機軟件或相關專業,豐富的java開發經驗和互聯網背景優先。
7.具有比較強的問題分析和處理能力,有比較優秀的動手能力,熱衷技術,精益求精
大數據架構師的基本職責 篇2
職責:
1. 深刻理解政府行業業務模式,構建政府行業的數據模型,制定公司大數據技術發展路線;
2. 對接業務研究和技術部門,主動搜集和轉化需求,組織數據中心業務開發,進行數據相關產品需求分析和設計;
3. 搭建數據倉庫,研發數據庫管理系統,搜集、提取、處理業務積累的海量數據,開展數據分析和挖掘;
4. 根據公司戰略和發展需要,規劃數據中心重點工作和任務;落實部門人員、事務管理,開展跨部門、跨地區協作,協助對外交流與合作。
職位要求:
1. 5年以上相關工作經驗,有團隊管理和項目管理經驗者優先;
2.了解政府運作機制,掌握財政行業知識,有電子政務行業經驗者優先;
3. 熟練掌握使用Java或Python,精通數據庫查詢語言如SQL,Oracle等,在機器學習模型和算法方向有應用經驗者優先;
4. 具備數據中心產品策劃整體思維,有大數據處理、分析、挖掘經驗者優先;
5. 邏輯思維嚴密,具備業務抽象、分解和標準化的能力,口頭和書面表達優秀;
6. 有較強的大局意識和良好的團隊合作意識,富有領導力,具備優秀的人際交往和溝通能力。
大數據架構師的基本職責 篇3
職責:
1、負責大數據平臺的架構設計、核心代碼開發等任務;根據項目要求編寫相關技術文檔;
2、負責大數據平臺的架構評審,代碼評審,上線評審;參與數據應用需求、設計、審核和評審;
3、負責核心模塊研發,負責大數據平臺的搭建,完成系統調試、集成與實施;
4、負責建立和維護大數據平臺技術標準規范,指導開發人員編寫代碼;
任職要求:
1、本科及以上計算機相關專業畢業;
2、精通離線和實時數據處理流程,掌握離線數據處理框架hive、impala、spark-sql等,掌握實時數據處理常用技術工具,包括Storm、SparkStreaming等;
3、熟悉大數據技術生態圈,精通大數據技術架構,有大數據平臺構建經驗;
4、掌握常見數據流接入工具,包括Flume、kafka等;
5、熟練掌握基本的Linux操作系統和某種腳本語言編程(如Shell等);
6、掌握一種或以上實時處理語言,如JAVA、SCALA、PYTHON等,有SCALA經驗者優先;
7、有實際大規模數據(TB級以上)處理經驗優先;
大數據架構師的基本職責 篇4
職責:
1、從事電信行業大數據項目相關業務調研、產品標準建設、核心模型設計和優化、系統測試等相關工作
2、與數據專業委員會一起研究數據建模方案和建模工具,負責產品線產品的數據架構、數據模型設計
3、參與研究數據庫之間的數據轉換方式,參與項目中的數據移植工作,收集在項目中的數據移植經驗,優化產品的數據模型
4、負責培訓本部門隊伍的數據模型基礎理論工作,建立數據模型團隊
崗位要求:
1、統招本科學歷,3年以上主流數據上(DB2、Oracle、SQLServer、Mysql等)ETL設計、開發經驗,具備大型數據倉庫邏輯模型和物理模型設計經驗,精通SQL,有較好的SQL性能調優經驗;
2、擁有Python,R等數學建模工具的使用經驗,并具備一定的數據處理和建模經驗,可以輸出相應的模型分析結果、模型比較、模型效率以及對模型的理論和判斷依據方法并對其進行完整的解釋和說明;
3、熟悉統計學基本原理,做過實戰的數據建模項目;
4、有分布式數據倉庫建設相關經驗者優先,具備電信行業數據倉庫建設相關經驗者優先;
大數據架構師的基本職責 篇5
職責:
1、負責公司的大數據處理框架的研發設計工作,梳理可實現方案和技術規范;
2、開發、完善公司大數據平臺;參與公司離線、實時大數據處理系統的設計、開發、測試及多個業務模塊的自動化集成;
3、負責業務平臺數據統計分析模塊的設計與規劃;
4、負責公司產品研發過程中的數據及存儲設計;
5、帶領和培養團隊完成組織分解的目標;
任職要求:
1、統招本科及以上學歷,計算機、軟件工程相關專業,至少8年以上工作經驗,5年以上大數據開發經驗;
2、熟悉Java、Hadoop、HDFS、Hive、HBase、Spark、Storm、Flume等相關技術的基礎架構
3、熟悉數據倉庫,數據算法,分布式計算技術理論,具有大數據整體系統架構設計經驗;
4、熟悉Linux系統,熟練使用shell/perl/python腳本處理問題;
5、對深度學習框架(Tensorflow)和機器學習(svm 隨機深林貝葉斯等)有一定了解的優先;
6、能夠組織項目開發組協同工作,包括團隊溝通、計劃、開發環境管理等
大數據架構師的基本職責 篇6
職責:
1、負責自然語音交互、IOT家電物聯控制、知識圖譜等相關模塊和系統的開發;
2、負責掌握第三方接口的調用和功能實現,持續優化服務性能和容量,并保證產品的兼容性和執行效率;
3、根據設計文檔和需求說明完成代碼編寫、調試、單元測試與維護,確保項目進度和質量;
4、協助制定測試計劃,及時發現并修復BUG,實現服務端的性能優化。
任職資格:
1、大學本科3年以上工作經驗,計算機相關專業;
2、熟悉軟件項目開發流程,具有良好編碼風格及文檔編寫能力;
3、熟悉Linux服務器相關技術,能夠獨立完成服務器部署,具有相關經驗;
4、熟悉Hadoop/Spark框架,JAVA基礎扎實;
5、熟練使用Mysql數據庫,了解MongoDB或neo4j等分布式數據庫;
6、熟悉SpringCloud,SSM,Docker,redis開發者優先;
7、熟悉前端(包括但不限于Html5、css、Angularjs、ajax、jquery等)開發技術優先;
8、了解Socket網絡編程、MQTT等,有相應實踐經驗者優先;
9、有智能語音語義、知識圖譜服務端開發經驗者優先。
大數據架構師的基本職責 篇7
職責:
1、負責大數據平臺架構的規劃與設計;
2、負責大數據平臺技術框架的選型與技術難點攻關;
3、參與企業級大數據產品和應用規劃;
4、研究跟進大數據架構領域新技術并分享;
5、大數據處理和分析應用平臺的設計指導。
任職資格:
1、 具備深厚的分布式系統或數據庫系統的理論基礎,熟悉分布式計算系統的工作機制,具有分布式文件系統、分布式數據庫系統、集群存儲系統等架構設計經驗;
2、熟悉BI平臺架構及相關項目標準,大數據解決方案包括Hadoop、Spark、Storm、機器學習等大數據平臺解決方案;
3、熟悉MySql/Postgresql/Oracle/MongoDB/Redis等主流數據數據庫;
4、 精通Linux/Unix環境,精通J java、scala、python、R中的一種或多種語言;
5、 具備優秀的團隊意識和溝通能力,學習能力和主動性強,具有鉆研精神,充滿激情,樂于接受挑戰;
6、大專及以上學歷,3年及以上工作經驗。
大數據架構師的基本職責 篇8
職責:
負責公司大數據產品架構的設計與實現;
配合大數據產品經理完成產品的快速研發與交付;
負責大數據產品架構的持續優化設計;
負責大數據產品核心組件設計;
負責大數據相關數據架構規劃、數據建模、數據庫設計以及大數據產品研發工作;
為應用開發團隊提供技術支撐。
任職要求:
本科及以上學歷,3年以上的大數據開發經驗、
2年以上大數據架構設計經驗;
豐富的JAVA研發經驗,精通JAVA,熟悉Python Scala等編程語言;具備深厚的分布式系統或數據庫系統的理論基礎,熟悉分布式計算系統的工作機制,具有分布式文件系統、分布式數據庫系統、集群存儲系統等架構設計經驗;
熟悉整個大數據的完整處理流程(數據的采集、清洗、預處理、存儲、分析挖掘、機器學習和數據可視化);
精通各種大數據相關技術體系:Hadoop、Spark、Storm、ElasticSearch、Kafka;
有數據挖掘、機器學習相關應用或研究背景;
溝通能力較好,積極主動意識較強,責任心較強。
大數據架構師的基本職責 篇9
職責:
1. 負責大數據基礎平臺、海量數據存儲/處理分布式平臺、數據分析系統架構設計和研發;
2. 負責實時計算平臺基礎架構設計、部署、監控、優化升級;
3. 制定項目/數據倉庫設計及實現規范,指導設計研發和部署;
4. 協助策略和算法團隊工作,保障數據挖掘建模和工程化;
5. 深入研究大數據相關技術和產品,跟進業界先進技術。
任職要求:
1. 全日制本科及以上學歷,5年以上軟件和分布式系統研發經驗,3年以上大數據系統架構經驗;
2. 精通Hadoop/HBase/Spark/Storm/Redis技術及其生態圈;
3. 具備Java/C++/Scala等開發經驗,熟悉數據挖掘和分析的策略與算法;
4. 具備良好的系統分析能力、故障診斷能力;
5. 有大數據策略、算法、可視化經驗優先;
6、211/985 重點學校畢業優先。
大數據架構師的基本職責 篇10
1. 負責數瀾大數據平臺的架構設計和研發,建立數據生態服務,解決海量數據面臨的挑戰;
2. 管理和優化Hadoop、Spark等集群,計算作業的調優,保證集群和平臺的高效和穩定;
3. 負責Hadoop、Spark、Flink的功能、性能和擴展,解決并實現業務需求;
4. 負責大數據產品的自動化、離線與實時計算、即席計算、數據質量、數據安全、機器學習等平臺的設計和開發;
5. 調研和把握當前的最新技術,將其中的先進技術引入到自己的平臺中,改善產品,提升競爭力;
大數據架構師的基本職責 篇11
職責:
1.能夠帶領技術人員基于hadoop平臺進行海量數據應用系統開發;
2.負責結構化和非結構化數據的解析和清洗,海量數據查詢和報表展現;
3.負責超大規模數據平臺的搭建、維護和優化;
4.負責大數據采集、存儲框架研究,參與在線或離線數據存儲模型設計;
5.負責大數據平臺新技術的開發使用和性能優化,測試。
任職資格:
1.計算機相關專業本科及以上學歷;
2. 熟悉hadoop相關各種開源項目,比如HDFS/Hive/Hbase等有實際應用。(5年以上開發經驗者優先);
3.兩年以上熟練編寫mapreduce代碼經驗,有三年以上網絡日志分析、ETL經驗。熟悉日志分析框架chukwa,flume,scribe者優先;
4.兩年以上海量數據存儲的安裝部署、優化、二次開發經驗,對大規模數據存儲、傳輸、處理等有豐富的經驗;
5.在數據挖掘、數據密集型處理、分布式計算、網格計算領域有深入理論基礎;
6.具有較強的文檔撰寫能力,較強的團隊精神和合作精神,對工作有熱情,能承受壓力。
大數據架構師的基本職責 篇12
職責:
1. 負責大數據基礎和應用平臺的整體規劃和架構設計,參與需求分析,架構設計,詳細設計以及技術選型決策
2. 參與數據挖掘和建模相關核心算法的代碼實現
3. 負責大數據算法平臺的技術把關,性能調優,控制架構質量,解決項目技術難題;對研發項目和任務需求進行評估和方案設計、拆分任務并指導工程師完成開發
4. 帶領團隊提供并實現大數據算法平臺上各項數據接入、數據挖掘分析及數據可視化的架構設計與能力,支持解決方案實施
5. 負責數據庫設計、應用架構設計、核心技術選型等工作
6. 協調解決開發中的技術問題、設計和監控運營指標,保障系統穩定運行
7. 培養,指導有能力的員工,指導工程師進行技術驗證實現,核心技術攻關,解決開發過程中的技術難題
任職要求:
1. 熟悉大數據和數據倉庫的系統架構設計方法
2. 熟練使用并理解HadoopSpark架構及生態。(Hadoop,Hive,Hbase,Elasticsearch,Kafka,SparkFlink等)
3. 熟悉分布式系統架構,有分布式實時、離線和機器學習平臺的架構和開發經驗,具備海量數據清洗、分析處理及存儲的實踐經驗
4. 熟練使用JAVA,具有大規模分布式系統調優經驗
5. 熟悉AI相關算法,熟悉機器學習、深度學習。熟悉AI學習開源框架(Tensorflow、PyTorch等)者優先;
6. 具備良好的團隊合作精神,對工作充滿激情。
7. 熟悉FusionInsight平臺開發經驗者優先
大數據架構師的基本職責 篇13
職責:
1、搭建基于Hadoop/Spark的數據挖掘體系和大數據分析系統架構;
2、研究大數據領域前沿數據挖掘技術,并引入相應技術在數據中心的使用;
3、進行大數據系統框架設計、模型算法開發;
4、負責大型數據挖掘項目方案制定、項目實施落地及優化等 ;
5、開展數據爬取、聚類分析、輿情分析、魚骨圖分析、定價策略等領域數據挖掘工作;
任職資格:
1、本科以上學歷(持有學士學位)(985,211優先),計算機相關專業,五年工作經驗;
2、二年以上數據挖掘項目經驗,完整參與過數據挖掘大數據平臺的架構開發過程,具備互聯網行業背景優先;
3、精通分布式計算框架(hadoop、spark、Storm等)及相關經驗,熟練掌握Hive/SQL,Python,熟悉Python、R相關數值科學計算庫(NumPy,SciPy等);
4、了解傳統的BI/DW 理論,能結合傳統BI實踐設計大數據平臺;
5、熟悉常用機器學習算法(如分類、回歸、聚類、關聯規則等)及其原理,具備應用場景經驗,如用戶畫像、商品關聯度分析、輿情分析;
6、熟悉主數據、元數據、數據質量、和數據建模等數據治理相關的體系和方法;
7、具備較強的邏輯思維能力、數據敏感度,擅于利用數據發現問題及解決問題;
大數據架構師的基本職責 篇14
職責:
負責大數據平臺架構的規劃和設計,主導系統的架構設計和核心模塊開發,確保項目質量和關鍵性能指標達成;
負責大數據平臺技術框架的選型與技術難點攻關,指導開發大數據平臺的開發,保證大數據產品的上線運行;
負責深入理解業務需求,對業務建模,設計系統架構,滿足業務需求;
負責協助策略和算法工作,保障數據挖掘建模和工程化;
負責根據業務需求整合優化數據架構,保證產品的可靠性、穩定性;
負責指導開發人員完成數據模型規劃建設、分析模型構建及分析呈現;
負責研發技術發展方向,新技術領域的探索,將新技術應用到公司大數據平臺,提升公司效能
任職要求:
本科及以上學歷,擁有5年以上大數據平臺產品或分布式系統設計經驗,6年以上的開發經驗;
精通Hadoop,熟悉大數據生態技術,如Storm、Spark、Scala、Flume、Kafka、Zookeeper、Yarn、Sqoop、CDH、Solr 、Kylin、Impala、Hive、Hbase、Kerberos、Sentry等,有大規模集群架構、開發及運維經驗;
熟練掌握java/Scala語言,實現面向對象開發思想OOA,OOD,OOP;
熟悉linux操作系統,熟練掌握腳本言語Shell/Perl/Python等編碼語言;
熟練掌握數據倉庫設計,開發工作。能夠根據業務設計并開發數據倉。
具備源碼級問題解決和集群優化改造能力者優先;
能快速的學習新的開源框架和知識體系,并應用到現有架構體系中;
邏輯清晰,快速的學習能力,良好的溝通能力、團隊協調能力。
具備良好的團隊合作精神,較強的溝通交流能力,具備良好的技術領導能力;
具備良好的文檔撰寫能力和技術團隊管理能力
大數據架構師的基本職責 篇15
職責:
1. 規劃設計大數據平臺整體架構,規劃各種組件,并且指導技術團隊完成相關系統驗證、安裝、部署、配置;
2. 負責制定大數據平臺技術規范和接口規范,指導研發團隊按照規范進行系統開發;
3. 配合商務人員完成售前技術支持工作;
4. 完成其他與數據應用有關的技術工作;
任職要求:
1. 計算機相關專業本科學歷,5年以上工作經驗;
2. 對大數據技術棧有非常深刻的了解;具備架構設計的實際經驗;
3. 對信息安全架構設計及實施有一定的經驗;
4. 熟悉Linux、Windows等操作系統的安裝配置;
5. 熟悉互聯網應用的安裝配置;熟悉常見大數據技術棧組件的安裝配置;熟悉Visio等繪圖工具的使用;
6. 有衛生信息化建設經驗者優先;有容器安裝部署經驗者優先。
大數據架構師的基本職責 篇16
職責:
1、負責大數據項目平臺架構的評估、規劃和設計
2、開發大數據平臺的核心模塊代碼,負責大數據平臺的搭建,完成系統調試、集成與實施,保證大數據產品的上線運行
3、根據業務需求整合優化數據架構,保證產品的可靠性、穩定性
4、指導開發人員完成數據模型規劃建設,分析模型構建及分析呈現
5、深入研究大數據相關技術和產品,跟進業界先進技術;
6、根據項目要求編寫相關技術文檔;
7、負責大數據平臺的架構評審,代碼評審,上線評審;參與數據應用需求、設計、審核和評審;
8、負責核心模塊研發,負責大數據平臺的搭建,完成系統調試、集成與實施;
9. 負責關鍵功能的開發,技術難題的解決,以及輸出代碼的關鍵把控;
10. 負責對使用關鍵技術的預研和選型,完成 PoC ;
11. 指導工程師完成開發工作,并能分享技術經驗。
任職資格:
1、精通Linux操作系統,熟練使用Java;
2、3年以上大數據項目實戰經驗,兩個項目的架構設計經驗,熟悉Hadoop、Hbase、Storm、Spark、Pig等開源框架,并熟悉其工作原理;
3、有Hadoop、Spark、Hbase平臺性能調優經驗;
4、熟悉其它分布式存儲相關技術,包括HDFS,Hive、Redis、Mongodb、 Flume、Kafaka、Sqoop、Zookeeper、ElasticSearch等;
5、熟悉Java開發常用框架.如Spring、MyBatis等;
6、熟悉關系型數據庫如oracle及數據庫編程。
7、能夠根據項目情況安排人力、分配任務,具有較強的團隊管理能力。
8、碩士以上學歷,20xx年以上的工作經驗。