PINGAN logo
中国平安
数据工程师

数据工程师

发布于 大约 2 个月前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
数据分析与科学
数据仓库
ETL

AI 估算 · 20k–40k

北京大厂数据工程师,技术栈主流,市场需求大,薪资有竞争力

职位详情

关于这个职位

这是一份数据工程师职位,负责大数据平台的数据采集、存储与计算,参与基础组件架构设计,并开发实时与离线数据应用

你将管理Hadoop、Spark等集群,跟踪大数据生态前沿技术
适合有扎实分布式系统基础和ETL经验的技术人才

最低要求

本科及以上学历

熟悉分布式系统的基础理论知识,了解大数据处理的常用算法
熟悉Java,Scala和Python等常用的大数据开发语言,有扎实的开发功底
熟悉Hadoop,Hive,Spark,Hbase,Flink,Kafka等大数据组件及技术
精通SQL优化和大数据计算平台性能优化
有数据仓库ETL经验,对于作业调度、数据治理,数据质量管理有较为深入的理解
具有良好的沟通能力,具有较强的分析和解决复杂问题的能力

工作职责

负责大数据平台的各类数据的采集、接入、存储和计算工作

参与大数据平台各类基础组件的的架构设计和系统建设
负责各类实时和离线大数据应用的开发工作,包括且不限于:指标,标签,在线分析,用户画像,数据可视化,数据挖掘,数据服务等
负责Hadoop,Hive,Spark等存储和计算集群的管理,优化工作
跟踪大数据生态的最新动态,推进平台的持续演进和组件优化

优先资格

有埋点数据的采集,处理,建模和可视化经验优先

了解银行风控数据、有风控规则加工经验优先

AI 洞察

优缺点分析

优点

  • 大平台、成熟的技术栈和丰富的业务场景,能积累大规模数据处理经验
  • 接触金融风控等核心业务,拓宽行业知识,提升数据应用价值
  • 技术氛围浓厚,有完善的培训和晋升体系,适合长期职业发展
  • 技术深度和广度要求高,需持续学习新组件和优化方法
  • 北京办公,可能面临通勤和加班问题(尤其是项目上线期间)
  • 适合具备大数据技术基础、热爱技术深耕、希望在金融科技领域长期发展的求职者

缺点 / 挑战

  • 金融行业对数据质量和安全要求严苛,工作压力较大

角色解读

  • 从数据工程师可成长为大数据架构师或技术专家,负责平台整体设计
  • 可向数据科学家或AI工程方向转型,利用数据驱动业务决策
  • 在平安金融科技体系内,有机会深入风控、营销等业务领域,成为复合型人才
  • 负责大数据平台的数据采集、接入、存储和计算,确保数据流程稳定高效
  • 参与基础组件的架构设计和系统建设,优化Hadoop、Spark等集群性能
  • 开发实时和离线数据应用,如用户画像、数据可视化、数据挖掘等
  • 跟踪大数据生态最新技术,推动平台演进和组件升级
  • 扎实的分布式系统理论和算法基础,能够设计高可用数据架构
  • 精通Java、Scala、Python,熟练使用Hadoop、Spark、Hive等主流大数据组件
  • 深厚的SQL优化和大数据计算平台调优能力,确保数据处理效率
  • 丰富的ETL和数据仓库经验,熟悉数据治理与质量管控流程

申请策略

  • 关注平安大数据平台的技术博客或开源项目,展示你的学习热情
  • 面试时准备一个完整的数据项目案例,从需求到架构到实现与优化
  • 突出大数据项目经验,尤其涉及Hadoop、Spark集群的搭建和优化
  • 展示ETL流程设计、数据仓库建模或实时计算案例
  • 如有埋点数据或风控相关经验,务必重点描述
  • 强调SQL优化和性能调优的具体成果(如查询提速百分比)
  • 深入学习Flink和Kafka,补齐实时计算短板
  • 复习数据治理和数据质量管理理论,准备相关面试问题

面试指南

  • 使用STAR法则:情境、任务、行动、结果,突出技术选型和优化效果
  • 对于架构设计题,先明确需求和数据量级,再分层设计,并说明容错和扩展性
  • 遇到故障排查题,展示系统化思维方式:从现象→日志→指标→根因→修复→复盘
  • 描述一次你优化Spark任务性能的经历?用了哪些方法?
  • Hive和HBase的区别?什么场景下选HBase?
  • 数据仓库建模的星型和雪花型有何优缺点?
  • 如何处理数据倾斜问题?举例说明
  • 如果让你设计一个实时用户画像系统,你会怎么设计?

匹配度报告

68
综合匹配度

大厂稳定、技术主流、薪资中上,WLB一般。

适合人群
适合看重技术成长和平台稳定性的求职者,对加班和通勤有一定容忍度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展85
工作生活50
使命价值60

薪资福利匹配

75中等

平安为上市大厂,薪资在行业中上水平,福利体系完善,但JD未明确说明具体福利。

薪资信号未披露(AI估算:20K-40K/月)

成长发展匹配

85较高

技术栈主流且前沿,涉及Hadoop/Spark/Flink等,能接触大数据平台架构和优化,成长空间大。

技术前沿主流现代技术
技术栈Hadoop、Spark、Hive、Flink、Kafka、Java、Scala、Python
业务类型ambiguous

工作生活匹配

50较低

北京现场办公,未提及弹性工作或远程选项,金融行业可能有一定加班压力。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

60中等

金融科技行业稳定,数据风控等业务有一定社会价值,但使命导向不突出。

行业发展稳定成熟行业
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs