ASML logo
阿斯麦
Data Engineer

Data Engineer

发布于 大约 1 个月前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
硕士
数据分析与科学
机器学习
深度学习
数据管道
ETL
预测性维护

AI 估算 · 25k–40k

资深数据工程师,上海外企,技术栈前沿,薪资有竞争力。

职位详情

关于这个职位

加入ASML客户支持诊断团队,作为数据工程师,你将负责构建和运营AI驱动的诊断与预测性维护解决方案

你需要设计云原生数据管道、开发机器学习模型,并与领域专家协作提升设备可用性和服务效率
该职位涉及从数据探索到模型部署的全生命周期管理,适合有志于将数据科学应用于工业场景的资深工程师

最低要求

硕士学位,专业为数据科学、计算机科学、工程、应用数学或相关领域

年以上数据科学、数据工程或高级分析相关经验
精通Python,熟悉分析和机器学习库
具备脚本编写能力(如PERL、Bash、PowerShell)
有在产环境中开发和部署机器学习/深度学习模型的经验
熟练使用基于云的数据平台(Azure优先),包括Databricks、Spark、SQL/Kusto
有SQL ETL流程经验
扎实的统计学、数据分析、SPC/FDC概念和分析问题解决能力
有处理大规模、高频数据流的经验

工作职责

AI、分析与模型所有权:设计、开发、部署和维护用于预测性维护(PdM)、故障检测与分类及根因识别和可观测性改进的机器学习和深度学习模型

拥有端到端模型生命周期,包括问题定义、数据探索、特征工程、模型开发、验证、部署、监控和再训练
根据现场反馈、诊断结果和新数据持续改进模型性能
数据工程与平台开发:设计并实现可扩展的云原生数据管道,用于摄取、转换和供应大量结构化和非结构化机器数据
使用Azure、Databricks、Spark、Kusto等平台确保可靠、高性能和安全的数据访问
确保下游分析和AI应用的数据质量、可追溯性和可重复性
通过概念验证管道实现数据早期访问,同时确保平稳过渡到生产级解决方案
诊断领域赋能:通过识别数据缺口、定义所需信号以及将诊断需求转化为数据和模型需求,改善基于机器数据的可观测性
识别诊断服务的结构性改进,包括流程、方法和分析方法
与诊断专家紧密合作,确保解决方案可操作、可解释并嵌入诊断工作流
标准、治理与利益相关者协作:定义并遵循数据、模型和分析解决方案的标准、策略和协议
确保解决方案符合ASML要求,具备合规性、可管理性、可扩展性和安全性
将技术成果转化为可衡量的服务影响(如MTTR降低、工时节省、命中率提升)
向高级利益相关者和领导层传达结果、见解和建议
在需要时为同事和利益相关者提供指导与知识分享

优先资格

有诊断、制造、设备数据或工业系统经验

熟悉ASML机器数据和CS诊断工作流
有改善复杂系统可观测性、故障检测或预测性维护的经验
有与业务利益相关者合作并向非技术受众解释技术结果的经验
有培训他人和创建技术文档或用户手册的经验

AI 洞察

优缺点分析

优点

  • 加入半导体巨头,接触前沿的工业AI与预测性维护技术
  • 全栈数据与AI工作,从数据工程到模型部署,技能积累全面
  • 外企文化与国际化团队,提供全球化视野和职业发展机会
  • 薪资福利有竞争力,且公司稳定性高
  • 涉及复杂工业系统和专有数据,学习曲线较陡峭
  • 模型落地要求高,需持续迭代以满足严格的可用性和准确性目标

缺点 / 挑战

  • 需要跨团队协作,沟通成本较高,需向非技术利益相关者解释成果
  • 适合有扎实数据工程基础、希望深入工业AI领域、能接受复杂问题挑战的资深技术人才

角色解读

  • 向数据科学家或机器学习专家方向发展,深化算法与模型创新能力
  • 晋升为技术负责人或架构师,主导数据平台和AI基础设施设计
  • 横向转入诊断领域专家或产品管理,结合业务与技术的复合角色
  • 设计和维护机器学习模型,用于预测设备故障和根因分析
  • 构建云原生数据管道,处理大规模机器数据并确保数据质量
  • 与诊断专家协作,将领域知识转化为可实施的AI解决方案
  • 管理模型的完整生命周期,包括部署、监控和迭代优化
  • 精通Python和机器学习库,具备生产环境部署经验
  • 熟练使用Azure、Databricks、Spark等云数据平台
  • 扎实的统计学和数据分析基础,理解SPC/FDC等工业概念
  • 处理高频数据流和大规模数据工程问题的能力

申请策略

  • 深入了解ASML的诊断业务目标,面试时展现你如何通过数据科学解决实际问题
  • 强调你对模型生命周期管理的理解,而不仅仅是建模
  • 突出生产级机器学习项目,尤其是预测性维护或异常检测相关
  • 强调云平台经验,特别是Azure和Databricks的实战案例
  • 展示处理大规模、高频数据流的经验,可附性能指标(如吞吐量、延迟)
  • 体现跨团队协作和向非技术人员沟通的成果
  • 熟悉ASML相关的半导体设备数据与诊断流程(可通过公开资料了解)
  • 补充SPC/FDC等工业统计方法的知识

面试指南

  • 用STAR法则(情境、任务、行动、结果)结构化描述项目经验
  • 对技术问题,先解释核心概念,再结合你实际采用的方法和权衡
  • 沟通类问题强调同理心、数据可视化和简化技术术语
  • 请描述一个你从零构建并部署到生产的机器学习项目
  • 如何处理大规模、高频率的传感器数据?你的数据管道设计思路是什么?
  • 你如何评估预测性维护模型的效果?有哪些关键指标?
  • 请解释SPC和FDC的概念,以及它们如何与数据分析结合
  • 当非技术人员质疑你的模型结果时,你如何沟通?

职位点评

74
综合评分

ASML资深数据工程师,前沿技术栈,高成长性,现场办公薪资优。

更适合这类人
最看重技能成长和技术前沿的求职者,能接受现场办公和一定工作强度。
表现最好
成长发展
相对薄弱
工作生活
薪资福利80
成长发展85
工作生活60
使命价值70

薪资福利

80较高

ASML作为跨国巨头提供有竞争力的薪资和福利,但JD未明确数字,外企通常福利完善。

薪资信号面议 (25K-40K/月)

成长发展

85较高

职位涉及前沿的AI和工业数据分析,技术栈现代,有模型全生命周期和跨团队协作,成长空间大。

技术前沿前沿/新兴技术
技术栈Python、Azure、Databricks、Spark、Kusto、机器学习、深度学习、预测性维护
业务类型ambiguous

工作生活

60中等

仅现场办公,未提弹性工作,工作强度可能较高;但外企通常合规。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值

70中等

半导体行业是国家战略领域,但JD未直接强调社会价值,偏向技术实现。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs