携程的AI Infra 研发工程师（GPU 推理方向）(MJ034962)薪资是多少？

该职位薪资范围为 30k–50k（人民币/月）。

AI Infra 研发工程师（GPU 推理方向）(MJ034962)的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

携程的AI Infra 研发工程师（GPU 推理方向）(MJ034962)有什么任职要求？

该职位要求本科学历及初级经验工作经验。

携程

AI Infra 研发工程师（GPU 推理方向）(MJ034962)

立即应聘

AI Infra 研发工程师（GPU 推理方向）(MJ034962)

发布于大约 2 个月前

普通员工/个人贡献者

上海市

初级经验

全职员工

仅现场办公

本科

软件工程

GPU

推荐系统

CUDA

深度学习推理

TensorRT

TVM

ONNX Runtime

Triton Inference Server

AI 估算 · 30k–50k

GPU推理是热门技能，携程大厂平台，上海薪资水平较高，该岗位经验要求1年以上，属于初级偏上，预计月薪30-50k。

职位详情

关于这个职位

该职位是携程推荐系统的GPU推理工程师，主要负责推荐模型在GPU上的推理加速与优化

你将参与CUDA算子开发、推理框架调优（TensorRT/ONNX Runtime等），以及性能分析工具（Nsight）的使用

适合对高性能计算和深度学习推理感兴趣的技术人才

最低要求

计算机及相关专业本科及以上学历，1 年以上 GPU / 高性能计算 / 深度学习推理相关研发经验

熟悉 CUDA 编程基础，了解 GPU 体系架构（SM、Warp、Memory Hierarchy、Tensor Core），具备编写和优化 CUDA kernel 的实践经验

熟悉至少一种主流深度学习推理框架（TensorRT / ONNX Runtime / TVM / Triton Inference Server），了解图优化、算子融合、量化等基本原理

了解主流推荐模型（DLRM、DIN、生成式推荐等）或 Transformer 类模型的结构与推理特点，对模型性能瓶颈有一定认识

熟练使用 c++/python/java等至少一种语言，熟悉 Linux 开发环境，代码规范、工程意识良好

有一定的问题定位与性能分析能力，能使用 Nsight Systems / Nsight Compute / perf 等工具完成基本的性能调优

学习能力强，具备良好的团队协作与沟通意识，能够与算法、业务、运维团队协作推进项目

工作职责

参与推荐系统 GPU 推理引擎的研发工作，支撑生成式推荐、排序、召回等业务场景的在线推理服务落地

参与 CUDA 算子开发与优化，包括算子融合、量化（INT8/FP8）、Tensor Core 使用、显存与访存优化等方向，持续提升单卡吞吐与推理延迟表现

参与推理图优化工作，基于 TensorRT / ONNX Runtime / TVM / Triton 等主流框架完成模型的图变换、算子替换、kernel 调优，协助推动模型高效上线

针对推荐模型的特点（稀疏 Embedding、变长序列、多塔结构等），协助完成定制化推理方案的开发与调优，解决 Host-Device 传输、KV Cache 管理等性能瓶颈

参与性能 profiling 与调优工作，熟练使用 Nsight、CUPTI 等工具完成性能分析，配合算法团队完成模型结构的性能评估

关注 GPU 推理、LLM Serving、推荐系统 Infra 的业界前沿进展（vLLM、SGLang、FlashAttention 等），积极学习并参与新技术在团队内的落地

优先资格

有推荐 / 搜索 / 广告系统 GPU 推理相关实习或项目经验者优先

有 LLM 推理加速相关经验（PagedAttention、Continuous Batching、量化推理等）者优先

有开源社区贡献经验（TensorRT-LLM、vLLM、FlashAttention、Triton、TVM 等）或在 MLSys 相关领域有论文 / 竞赛 / 技术博客产出者优先

有良好的英文技术文档阅读能力，有海外学习或工作经验者优先

AI 洞察

优缺点分析

优点

技术前沿：直接接触GPU推理、LLM加速、推荐系统等热门技术，技能含金量高
公司平台大：携程是上市巨头，业务稳定，内部技术氛围好，有大量实际场景落地
成长空间广：有机会参与开源社区贡献（如vLLM、TensorRT-LLM），提升行业影响力
技术门槛高：需要深入理解CUDA和GPU架构，学习曲线陡峭，需要持续跟进业界进展
竞争激烈：AI Infra方向人才稀缺但岗位要求高，需在项目经验和深度上不断积累
适合具备高性能计算背景、对GPU优化有浓厚兴趣、乐于钻研底层技术的工程师，尤其适合希望在AI系统方向长期发展的求职者

缺点 / 挑战

业务压力：推荐系统对延迟和吞吐要求高，线上问题排查和优化需要快速响应

角色解读

技术深耕方向：从GPU推理工程师逐步成长为AI Infra专家，精通高性能计算与系统优化
架构方向：晋升为系统架构师，负责大规模推理系统的设计与迭代
管理方向：带领团队负责推荐系统Infra的整体演进，转型为技术管理者
研发推荐系统的GPU推理引擎，优化模型在GPU上的推理性能和吞吐量
开发CUDA算子，进行算子融合、量化、Tensor Core优化等，提升计算效率
基于TensorRT等推理框架进行图优化和kernel调优，确保模型高效上线
使用Nsight等工具进行性能profiling，定位并解决性能瓶颈
扎实的CUDA编程基础和GPU体系架构理解，能独立编写和优化CUDA kernel
熟悉至少一种主流推理框架（如TensorRT/ONNX Runtime/TVM），了解图优化和量化原理
熟悉推荐模型或Transformer结构，了解其推理特点及性能瓶颈
熟练掌握C++/Python，具备良好的工程能力和Linux环境开发经验

申请策略

申请前了解携程推荐系统的业务场景，面试时结合业务展示技术方案的思考
强调学习能力和团队协作精神，因为该岗位需要和算法、运维等多团队紧密合作
突出GPU相关项目经验，特别是CUDA kernel开发、推理加速或推荐系统优化的具体成果
强调对推理框架（TensorRT/ONNX Runtime）的使用经验，并展示量化、融合等优化实践
如果有开源贡献（如vLLM、FlashAttention）或MLSys相关论文/竞赛，务必重点列出
深入学习CUDA编程模型和GPU体系架构，动手实现一些经典算子优化（如矩阵乘）
熟悉TensorRT-LLM或vLLM等最新推理框架，了解PagedAttention、Continuous Batching等前沿技术

面试指南

对于优化类问题：先明确优化目标（延迟/吞吐），然后分析瓶颈（计算/访存），再提出具体手段（算子融合、量化、访存优化等），最后举例说明效果
对于知识类问题：先给出定义和原理，再联系实际应用场景，最后展示深度（如提到的进阶技术）
请解释CUDA中的warp divergence及其对性能的影响，如何优化？
描述一下TensorRT的图优化过程，你知道哪些优化pass？
如何优化一个包含稀疏Embedding的推荐模型的推理延迟？
你用Nsight进行性能分析的经验，如何定位瓶颈？
说说你对FlashAttention或PagedAttention的理解，它们解决了什么问题？
复习CUDA编程模型和GPU架构细节，准备一个完整的CUDA kernel优化案例

职位点评

综合评分

大厂AI Infra核心岗，前沿技术栈，薪资有竞争力，但现场办公且WLB未明确。

更适合这类人

最适合重视技术成长、追求高薪和前沿挑战的求职者，对工作生活平衡要求不高的人。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展85

工作生活30

使命价值60

薪资福利

80较高

薪资在上海大厂中属于中上水平，但JD未提及额外福利，整体补偿性较好。

薪资信号偏高 (30K-50K/月)

成长发展

85较高

技术栈前沿（GPU推理、LLM加速），且强调学习新技术，发展空间大，但未明确晋升通道。

技术前沿前沿/新兴技术

技术栈CUDA、TensorRT、ONNX Runtime、TVM、Triton、vLLM、FlashAttention、LLM

成长机会积极学习并参与新技术在团队内的落地

业务类型profit_center

工作生活

30较低

仅现场办公，未提及弹性工作或WLB措施，生活方式灵活性较低。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

60中等

在线旅游行业稳定，AI推理助力业务增长有一定价值，但社会影响力一般。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

携程

AI Infra 研发工程师（GPU 推理方向）(MJ034962)

立即应聘

AI Infra 研发工程师（GPU 推理方向）(MJ034962)

发布于大约 2 个月前

普通员工/个人贡献者

上海市

初级经验

全职员工

仅现场办公

本科

软件工程

GPU

推荐系统

CUDA

深度学习推理

TensorRT

TVM

ONNX Runtime

Triton Inference Server

AI 估算 · 30k–50k

GPU推理是热门技能，携程大厂平台，上海薪资水平较高，该岗位经验要求1年以上，属于初级偏上，预计月薪30-50k。

职位详情

关于这个职位

该职位是携程推荐系统的GPU推理工程师，主要负责推荐模型在GPU上的推理加速与优化

你将参与CUDA算子开发、推理框架调优（TensorRT/ONNX Runtime等），以及性能分析工具（Nsight）的使用

适合对高性能计算和深度学习推理感兴趣的技术人才

最低要求

计算机及相关专业本科及以上学历，1 年以上 GPU / 高性能计算 / 深度学习推理相关研发经验

熟悉 CUDA 编程基础，了解 GPU 体系架构（SM、Warp、Memory Hierarchy、Tensor Core），具备编写和优化 CUDA kernel 的实践经验

熟悉至少一种主流深度学习推理框架（TensorRT / ONNX Runtime / TVM / Triton Inference Server），了解图优化、算子融合、量化等基本原理

了解主流推荐模型（DLRM、DIN、生成式推荐等）或 Transformer 类模型的结构与推理特点，对模型性能瓶颈有一定认识

熟练使用 c++/python/java等至少一种语言，熟悉 Linux 开发环境，代码规范、工程意识良好

有一定的问题定位与性能分析能力，能使用 Nsight Systems / Nsight Compute / perf 等工具完成基本的性能调优

学习能力强，具备良好的团队协作与沟通意识，能够与算法、业务、运维团队协作推进项目

工作职责

参与推荐系统 GPU 推理引擎的研发工作，支撑生成式推荐、排序、召回等业务场景的在线推理服务落地

参与 CUDA 算子开发与优化，包括算子融合、量化（INT8/FP8）、Tensor Core 使用、显存与访存优化等方向，持续提升单卡吞吐与推理延迟表现

参与推理图优化工作，基于 TensorRT / ONNX Runtime / TVM / Triton 等主流框架完成模型的图变换、算子替换、kernel 调优，协助推动模型高效上线

针对推荐模型的特点（稀疏 Embedding、变长序列、多塔结构等），协助完成定制化推理方案的开发与调优，解决 Host-Device 传输、KV Cache 管理等性能瓶颈

参与性能 profiling 与调优工作，熟练使用 Nsight、CUPTI 等工具完成性能分析，配合算法团队完成模型结构的性能评估

关注 GPU 推理、LLM Serving、推荐系统 Infra 的业界前沿进展（vLLM、SGLang、FlashAttention 等），积极学习并参与新技术在团队内的落地

优先资格

有推荐 / 搜索 / 广告系统 GPU 推理相关实习或项目经验者优先

有 LLM 推理加速相关经验（PagedAttention、Continuous Batching、量化推理等）者优先

有开源社区贡献经验（TensorRT-LLM、vLLM、FlashAttention、Triton、TVM 等）或在 MLSys 相关领域有论文 / 竞赛 / 技术博客产出者优先

有良好的英文技术文档阅读能力，有海外学习或工作经验者优先

AI 洞察

优缺点分析

优点

技术前沿：直接接触GPU推理、LLM加速、推荐系统等热门技术，技能含金量高
公司平台大：携程是上市巨头，业务稳定，内部技术氛围好，有大量实际场景落地
成长空间广：有机会参与开源社区贡献（如vLLM、TensorRT-LLM），提升行业影响力
技术门槛高：需要深入理解CUDA和GPU架构，学习曲线陡峭，需要持续跟进业界进展
竞争激烈：AI Infra方向人才稀缺但岗位要求高，需在项目经验和深度上不断积累
适合具备高性能计算背景、对GPU优化有浓厚兴趣、乐于钻研底层技术的工程师，尤其适合希望在AI系统方向长期发展的求职者

缺点 / 挑战

业务压力：推荐系统对延迟和吞吐要求高，线上问题排查和优化需要快速响应

角色解读

技术深耕方向：从GPU推理工程师逐步成长为AI Infra专家，精通高性能计算与系统优化
架构方向：晋升为系统架构师，负责大规模推理系统的设计与迭代
管理方向：带领团队负责推荐系统Infra的整体演进，转型为技术管理者
研发推荐系统的GPU推理引擎，优化模型在GPU上的推理性能和吞吐量
开发CUDA算子，进行算子融合、量化、Tensor Core优化等，提升计算效率
基于TensorRT等推理框架进行图优化和kernel调优，确保模型高效上线
使用Nsight等工具进行性能profiling，定位并解决性能瓶颈
扎实的CUDA编程基础和GPU体系架构理解，能独立编写和优化CUDA kernel
熟悉至少一种主流推理框架（如TensorRT/ONNX Runtime/TVM），了解图优化和量化原理
熟悉推荐模型或Transformer结构，了解其推理特点及性能瓶颈
熟练掌握C++/Python，具备良好的工程能力和Linux环境开发经验

申请策略

申请前了解携程推荐系统的业务场景，面试时结合业务展示技术方案的思考
强调学习能力和团队协作精神，因为该岗位需要和算法、运维等多团队紧密合作
突出GPU相关项目经验，特别是CUDA kernel开发、推理加速或推荐系统优化的具体成果
强调对推理框架（TensorRT/ONNX Runtime）的使用经验，并展示量化、融合等优化实践
如果有开源贡献（如vLLM、FlashAttention）或MLSys相关论文/竞赛，务必重点列出
深入学习CUDA编程模型和GPU体系架构，动手实现一些经典算子优化（如矩阵乘）
熟悉TensorRT-LLM或vLLM等最新推理框架，了解PagedAttention、Continuous Batching等前沿技术

面试指南

对于优化类问题：先明确优化目标（延迟/吞吐），然后分析瓶颈（计算/访存），再提出具体手段（算子融合、量化、访存优化等），最后举例说明效果
对于知识类问题：先给出定义和原理，再联系实际应用场景，最后展示深度（如提到的进阶技术）
请解释CUDA中的warp divergence及其对性能的影响，如何优化？
描述一下TensorRT的图优化过程，你知道哪些优化pass？
如何优化一个包含稀疏Embedding的推荐模型的推理延迟？
你用Nsight进行性能分析的经验，如何定位瓶颈？
说说你对FlashAttention或PagedAttention的理解，它们解决了什么问题？
复习CUDA编程模型和GPU架构细节，准备一个完整的CUDA kernel优化案例

职位点评

综合评分

大厂AI Infra核心岗，前沿技术栈，薪资有竞争力，但现场办公且WLB未明确。

更适合这类人

最适合重视技术成长、追求高薪和前沿挑战的求职者，对工作生活平衡要求不高的人。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展85

工作生活30

使命价值60

薪资福利

80较高

薪资在上海大厂中属于中上水平，但JD未提及额外福利，整体补偿性较好。

薪资信号偏高 (30K-50K/月)

成长发展

85较高

技术栈前沿（GPU推理、LLM加速），且强调学习新技术，发展空间大，但未明确晋升通道。

技术前沿前沿/新兴技术

技术栈CUDA、TensorRT、ONNX Runtime、TVM、Triton、vLLM、FlashAttention、LLM

成长机会积极学习并参与新技术在团队内的落地

业务类型profit_center

工作生活

30较低

仅现场办公，未提及弹性工作或WLB措施，生活方式灵活性较低。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

60中等

在线旅游行业稳定，AI推理助力业务增长有一定价值，但社会影响力一般。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

AI Infra 研发工程师（GPU 推理方向）(MJ034962)

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

AI Infra 研发工程师（GPU 推理方向）(MJ034962)

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

携程 的其他在招职位

技术支持工程师(MJ035546)

线下项目运营(MJ035562)

资深业务运营(MJ035638)

国内税务实习生(MJ034422)

商旅结算专员（常白班）（260626）(MJ035480)

相似职位推荐

BIOS工程师

Senior Firmware Engineer

Industrial Engineering ES

Machine Learning Engineer

Industrial Engineering ES

携程 的其他在招职位

技术支持工程师(MJ035546)

线下项目运营(MJ035562)

资深业务运营(MJ035638)

国内税务实习生(MJ034422)

商旅结算专员（常白班）（260626）(MJ035480)

相似职位推荐

BIOS工程师

Senior Firmware Engineer

Industrial Engineering ES

Machine Learning Engineer

Industrial Engineering ES

携程的其他在招职位

携程的其他在招职位