PINGAN logo
中国平安
大数据工程师(医疗健康)

大数据工程师(医疗健康)

发布于 大约 16 小时前

普通员工/个人贡献者

深圳市
中级经验
全职员工
仅现场办公
本科
信息技术与基础设施
SQL
数据仓库
ETL
数据治理
医疗健康

AI 估算 · 15k–25k

深圳大数据岗位2年经验市场薪资约15-25k,平安大平台且医疗方向有溢价,中位数20k合理。

职位详情

关于这个职位

这是一个大数据工程师职位,属于中国平安医疗健康方向

你将负责大数据平台的数据采集、清洗、建模与分析,使用Hive、Spark等主流工具处理海量数据,并与业务部门协作提供数据支持
该岗位适合有2年以上大数据开发经验、熟悉Hadoop生态,并对医疗数据感兴趣的求职者

最低要求

学历要求:计算机、数学、统计学、信息管理或相关专业本科及以上学历

工作经验:2年以上大数据分析或数据开发相关工作经验
技术能力:
熟练掌握Hive、HDFS、MapReduce、Spark等大数据平台组件
精通SQL,具备复杂SQL编写与优化能力
熟悉MySQL、PG等关系型数据库的设计与使用,了解索引、事务、锁机制等
熟悉Linux操作系统,掌握Shell/Python等至少一种脚本语言
具备数据建模能力,了解星型模型、雪花模型等数据仓库设计方法
综合素质:
具备良好的沟通能力与团队协作精神
逻辑清晰,具备较强的数据敏感度和问题分析能力
有较强的学习能力,能快速适应新技术和业务场景

工作职责

负责公司大数据平台的数据采集、清洗、存储、建模与价值挖掘工作

使用Hive、Spark等大数据工具进行海量数据的处理与分析,构建稳定高效的数据处理流程
设计并开发数据仓库模型,优化ETL流程,保障数据的准确性与及时性
与业务部门协作,深入理解业务需求,提供数据支持与分析报告,辅助决策
参与数据治理、元数据管理及数据质量监控体系建设
有医疗行业背景者,参与医疗健康相关数据的分析建模,支持保司赋能、健康管理等应用场景

优先资格

有医疗健康行业数据分析经验,熟悉医院数据、医保数据、临床数据等优先

熟悉医疗数据标准(如疾病ICD编码、药品ATC编码等)者优先
有使用Hadoop生态组件(如HBase、Kafka、Flume等)经验者优先
具备数据挖掘项目经验者优先

AI 洞察

优缺点分析

优点

  • 平安作为大型金融科技集团,平台稳定、资源丰富,职业发展空间大
  • 医疗健康方向前景广阔,数据价值高,技能积累具有长期竞争力
  • 技术栈主流(Spark、Hive),与行业趋势契合,利于跳槽或深耕
  • 职位参与数据治理及建模,能全面锻炼大数据工程能力
  • 大数据处理对实时性和准确性要求高,需要较强的细节把控能力
  • 医疗数据复杂且敏感,可能涉及数据合规与隐私保护,增加工作难度
  • 与业务部门协作频繁,需要良好的沟通能力和业务理解力
  • 适合具备2年以上大数据开发经验、熟悉Hadoop生态、对医疗健康数据有兴趣,且希望在大型平台获得稳定发展的技术人才

缺点 / 挑战

暂无明显挑战项

角色解读

  • 从大数据工程师向数据架构师或数据科学家方向发展,深耕医疗健康数据领域
  • 横向可转向数据产品经理或数据分析管理岗位,纵向可晋升为团队技术负责人
  • 在平安体系内,可借助医疗健康赛道实现跨部门协作,积累行业经验
  • 负责大数据平台的数据采集、清洗与存储,搭建数据处理流水线
  • 使用Hive、Spark进行海量数据分析与建模,优化ETL流程
  • 与业务部门协作,深入理解医疗健康业务需求,提供数据支持与决策分析
  • 参与数据治理与质量监控,保障数据准确性和及时性
  • 精通Hive、Spark等大数据处理工具,具备复杂SQL编写能力
  • 熟悉Hadoop生态(HDFS、MapReduce)及数据仓库建模方法
  • 掌握Linux操作及至少一种脚本语言(Shell/Python)
  • 具备良好的沟通能力和数据敏感度,能快速理解业务

申请策略

  • 准备一个完整的数仓或ETL项目案例,从需求到实现清晰阐述
  • 了解平安医疗健康业务线(如平安好医生、智慧医疗),面试中体现行业兴趣
  • 突出大数据项目经验,尤其是使用Hive、Spark处理海量数据的案例
  • 强调SQL优化和数据建模能力,展示复杂查询和ETL设计经历
  • 如果有医疗健康相关项目或数据标准知识,务必重点提及
  • 展示对数据治理、质量监控的理解和实践
  • 加强Hive和Spark性能调优技能,学习更高级的SQL优化技巧
  • 了解医疗数据标准(如ICD编码、ATC编码),提升行业匹配度

面试指南

  • 对于技术问题,先明确场景和需求,再陈述技术选型和实现步骤,最后总结效果和可优化点
  • 对于业务沟通问题,采用STAR法则(情境-任务-行动-结果),强调主动性和协作成果
  • 请描述一个你用Spark处理大规模数据的项目,并说明如何优化性能
  • 如何设计一个数据仓库模型?请举例说明星型和雪花模型的应用场景
  • 在处理医疗数据时,你会如何保证数据质量和隐私安全?
  • 写一段SQL实现某个复杂查询(如用户留存分析),并解释优化思路
  • 你如何与业务部门沟通数据需求?请分享一次成功协作的经历
  • 复习Spark和Hive的核心原理及调优参数,准备一个手写复杂SQL的练习

匹配度报告

71
综合匹配度

大平台、主流大数据技术、医疗健康方向,但薪资面议、办公灵活性一般。

适合人群
适合优先考虑技能成长和稳定平台,对WLB要求不极端的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展80
工作生活60
使命价值70

薪资福利匹配

75中等

薪资面议,但平安作为上市公司福利完善,处于市场中等偏上水平。

薪资信号面议 (15K-25K/月)

成长发展匹配

80较高

技术栈主流且涉及医疗数据,学习曲线良好,但未明确晋升路径。

技术前沿主流现代技术
技术栈Hive、Spark、SQL、Hadoop、Python、Shell、数据仓库
业务类型ambiguous

工作生活匹配

60中等

仅现场办公,地点为深圳,未提及弹性工作,WLB信号不足。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

医疗健康领域有正向社会影响,行业稳定,但JD未强调使命感。

行业发展稳定成熟行业
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs