
中国平安
大数据工程师(医疗健康)
大数据工程师(医疗健康)
发布于 大约 16 小时前普通员工/个人贡献者
深圳市
中级经验
全职员工
仅现场办公
本科
信息技术与基础设施
SQL
数据仓库
ETL
数据治理
医疗健康
AI 估算 · 15k–25k
深圳大数据岗位2年经验市场薪资约15-25k,平安大平台且医疗方向有溢价,中位数20k合理。
职位详情
关于这个职位
这是一个大数据工程师职位,属于中国平安医疗健康方向
你将负责大数据平台的数据采集、清洗、建模与分析,使用Hive、Spark等主流工具处理海量数据,并与业务部门协作提供数据支持
该岗位适合有2年以上大数据开发经验、熟悉Hadoop生态,并对医疗数据感兴趣的求职者
最低要求
学历要求:计算机、数学、统计学、信息管理或相关专业本科及以上学历
工作经验:2年以上大数据分析或数据开发相关工作经验
技术能力:
熟练掌握Hive、HDFS、MapReduce、Spark等大数据平台组件
精通SQL,具备复杂SQL编写与优化能力
熟悉MySQL、PG等关系型数据库的设计与使用,了解索引、事务、锁机制等
熟悉Linux操作系统,掌握Shell/Python等至少一种脚本语言
具备数据建模能力,了解星型模型、雪花模型等数据仓库设计方法
综合素质:
具备良好的沟通能力与团队协作精神
逻辑清晰,具备较强的数据敏感度和问题分析能力
有较强的学习能力,能快速适应新技术和业务场景
工作职责
负责公司大数据平台的数据采集、清洗、存储、建模与价值挖掘工作
使用Hive、Spark等大数据工具进行海量数据的处理与分析,构建稳定高效的数据处理流程
设计并开发数据仓库模型,优化ETL流程,保障数据的准确性与及时性
与业务部门协作,深入理解业务需求,提供数据支持与分析报告,辅助决策
参与数据治理、元数据管理及数据质量监控体系建设
有医疗行业背景者,参与医疗健康相关数据的分析建模,支持保司赋能、健康管理等应用场景
优先资格
有医疗健康行业数据分析经验,熟悉医院数据、医保数据、临床数据等优先
熟悉医疗数据标准(如疾病ICD编码、药品ATC编码等)者优先
有使用Hadoop生态组件(如HBase、Kafka、Flume等)经验者优先
具备数据挖掘项目经验者优先
AI 洞察
优缺点分析
优点
- 平安作为大型金融科技集团,平台稳定、资源丰富,职业发展空间大
- 医疗健康方向前景广阔,数据价值高,技能积累具有长期竞争力
- 技术栈主流(Spark、Hive),与行业趋势契合,利于跳槽或深耕
- 职位参与数据治理及建模,能全面锻炼大数据工程能力
- 大数据处理对实时性和准确性要求高,需要较强的细节把控能力
- 医疗数据复杂且敏感,可能涉及数据合规与隐私保护,增加工作难度
- 与业务部门协作频繁,需要良好的沟通能力和业务理解力
- 适合具备2年以上大数据开发经验、熟悉Hadoop生态、对医疗健康数据有兴趣,且希望在大型平台获得稳定发展的技术人才
缺点 / 挑战
暂无明显挑战项
角色解读
- 从大数据工程师向数据架构师或数据科学家方向发展,深耕医疗健康数据领域
- 横向可转向数据产品经理或数据分析管理岗位,纵向可晋升为团队技术负责人
- 在平安体系内,可借助医疗健康赛道实现跨部门协作,积累行业经验
- 负责大数据平台的数据采集、清洗与存储,搭建数据处理流水线
- 使用Hive、Spark进行海量数据分析与建模,优化ETL流程
- 与业务部门协作,深入理解医疗健康业务需求,提供数据支持与决策分析
- 参与数据治理与质量监控,保障数据准确性和及时性
- 精通Hive、Spark等大数据处理工具,具备复杂SQL编写能力
- 熟悉Hadoop生态(HDFS、MapReduce)及数据仓库建模方法
- 掌握Linux操作及至少一种脚本语言(Shell/Python)
- 具备良好的沟通能力和数据敏感度,能快速理解业务
申请策略
- 准备一个完整的数仓或ETL项目案例,从需求到实现清晰阐述
- 了解平安医疗健康业务线(如平安好医生、智慧医疗),面试中体现行业兴趣
- 突出大数据项目经验,尤其是使用Hive、Spark处理海量数据的案例
- 强调SQL优化和数据建模能力,展示复杂查询和ETL设计经历
- 如果有医疗健康相关项目或数据标准知识,务必重点提及
- 展示对数据治理、质量监控的理解和实践
- 加强Hive和Spark性能调优技能,学习更高级的SQL优化技巧
- 了解医疗数据标准(如ICD编码、ATC编码),提升行业匹配度
面试指南
- 对于技术问题,先明确场景和需求,再陈述技术选型和实现步骤,最后总结效果和可优化点
- 对于业务沟通问题,采用STAR法则(情境-任务-行动-结果),强调主动性和协作成果
- 请描述一个你用Spark处理大规模数据的项目,并说明如何优化性能
- 如何设计一个数据仓库模型?请举例说明星型和雪花模型的应用场景
- 在处理医疗数据时,你会如何保证数据质量和隐私安全?
- 写一段SQL实现某个复杂查询(如用户留存分析),并解释优化思路
- 你如何与业务部门沟通数据需求?请分享一次成功协作的经历
- 复习Spark和Hive的核心原理及调优参数,准备一个手写复杂SQL的练习
匹配度报告
71
综合匹配度
大平台、主流大数据技术、医疗健康方向,但薪资面议、办公灵活性一般。
适合人群
适合优先考虑技能成长和稳定平台,对WLB要求不极端的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展80
工作生活60
使命价值70
薪资福利匹配
75中等
薪资面议,但平安作为上市公司福利完善,处于市场中等偏上水平。
薪资信号面议 (15K-25K/月)
成长发展匹配
80较高
技术栈主流且涉及医疗数据,学习曲线良好,但未明确晋升路径。
技术前沿主流现代技术
技术栈Hive、Spark、SQL、Hadoop、Python、Shell、数据仓库
业务类型ambiguous
工作生活匹配
60中等
仅现场办公,地点为深圳,未提及弹性工作,WLB信号不足。
工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)
使命价值匹配
70中等
医疗健康领域有正向社会影响,行业稳定,但JD未强调使命感。
行业发展稳定成熟行业
社会影响正向社会影响力较高
创新程度积极采用新技术
中国平安 的其他在招职位
相似职位推荐
Watch Jobs