Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Trip.com logo
携程
AI Infra 研发工程师(GPU 推理方向)(MJ034962)
立即应聘

AI Infra 研发工程师(GPU 推理方向)(MJ034962)

发布于 大约 15 小时前

普通员工/个人贡献者

上海市
初级经验
全职员工
仅现场办公
本科
GPU
推荐系统
CUDA
深度学习推理
TensorRT
TVM
ONNX Runtime
Triton Inference Server

AI 估算 · 30k–50k

GPU推理是热门技能,携程大厂平台,上海薪资水平较高,该岗位经验要求1年以上,属于初级偏上,预计月薪30-50k。

职位详情

关于这个职位

该职位是携程推荐系统的GPU推理工程师,主要负责推荐模型在GPU上的推理加速与优化

你将参与CUDA算子开发、推理框架调优(TensorRT/ONNX Runtime等),以及性能分析工具(Nsight)的使用
适合对高性能计算和深度学习推理感兴趣的技术人才

最低要求

计算机及相关专业本科及以上学历,1 年以上 GPU / 高性能计算 / 深度学习推理相关研发经验

熟悉 CUDA 编程基础,了解 GPU 体系架构(SM、Warp、Memory Hierarchy、Tensor Core),具备编写和优化 CUDA kernel 的实践经验
熟悉至少一种主流深度学习推理框架(TensorRT / ONNX Runtime / TVM / Triton Inference Server),了解图优化、算子融合、量化等基本原理
了解主流推荐模型(DLRM、DIN、生成式推荐等)或 Transformer 类模型的结构与推理特点,对模型性能瓶颈有一定认识
熟练使用 c++/python/java等至少一种语言,熟悉 Linux 开发环境,代码规范、工程意识良好
有一定的问题定位与性能分析能力,能使用 Nsight Systems / Nsight Compute / perf 等工具完成基本的性能调优
学习能力强,具备良好的团队协作与沟通意识,能够与算法、业务、运维团队协作推进项目

工作职责

参与推荐系统 GPU 推理引擎的研发工作,支撑生成式推荐、排序、召回等业务场景的在线推理服务落地

参与 CUDA 算子开发与优化,包括算子融合、量化(INT8/FP8)、Tensor Core 使用、显存与访存优化等方向,持续提升单卡吞吐与推理延迟表现
参与推理图优化工作,基于 TensorRT / ONNX Runtime / TVM / Triton 等主流框架完成模型的图变换、算子替换、kernel 调优,协助推动模型高效上线
针对推荐模型的特点(稀疏 Embedding、变长序列、多塔结构等),协助完成定制化推理方案的开发与调优,解决 Host-Device 传输、KV Cache 管理等性能瓶颈
参与性能 profiling 与调优工作,熟练使用 Nsight、CUPTI 等工具完成性能分析,配合算法团队完成模型结构的性能评估
关注 GPU 推理、LLM Serving、推荐系统 Infra 的业界前沿进展(vLLM、SGLang、FlashAttention 等),积极学习并参与新技术在团队内的落地

优先资格

有推荐 / 搜索 / 广告系统 GPU 推理相关实习或项目经验者优先

有 LLM 推理加速相关经验(PagedAttention、Continuous Batching、量化推理等)者优先
有开源社区贡献经验(TensorRT-LLM、vLLM、FlashAttention、Triton、TVM 等)或在 MLSys 相关领域有论文 / 竞赛 / 技术博客产出者优先
有良好的英文技术文档阅读能力,有海外学习或工作经验者优先

AI 洞察

优缺点分析

优点

  • 技术前沿:直接接触GPU推理、LLM加速、推荐系统等热门技术,技能含金量高
  • 公司平台大:携程是上市巨头,业务稳定,内部技术氛围好,有大量实际场景落地
  • 成长空间广:有机会参与开源社区贡献(如vLLM、TensorRT-LLM),提升行业影响力
  • 技术门槛高:需要深入理解CUDA和GPU架构,学习曲线陡峭,需要持续跟进业界进展
  • 竞争激烈:AI Infra方向人才稀缺但岗位要求高,需在项目经验和深度上不断积累
  • 适合具备高性能计算背景、对GPU优化有浓厚兴趣、乐于钻研底层技术的工程师,尤其适合希望在AI系统方向长期发展的求职者

缺点 / 挑战

  • 业务压力:推荐系统对延迟和吞吐要求高,线上问题排查和优化需要快速响应

角色解读

  • 技术深耕方向:从GPU推理工程师逐步成长为AI Infra专家,精通高性能计算与系统优化
  • 架构方向:晋升为系统架构师,负责大规模推理系统的设计与迭代
  • 管理方向:带领团队负责推荐系统Infra的整体演进,转型为技术管理者
  • 研发推荐系统的GPU推理引擎,优化模型在GPU上的推理性能和吞吐量
  • 开发CUDA算子,进行算子融合、量化、Tensor Core优化等,提升计算效率
  • 基于TensorRT等推理框架进行图优化和kernel调优,确保模型高效上线
  • 使用Nsight等工具进行性能profiling,定位并解决性能瓶颈
  • 扎实的CUDA编程基础和GPU体系架构理解,能独立编写和优化CUDA kernel
  • 熟悉至少一种主流推理框架(如TensorRT/ONNX Runtime/TVM),了解图优化和量化原理
  • 熟悉推荐模型或Transformer结构,了解其推理特点及性能瓶颈
  • 熟练掌握C++/Python,具备良好的工程能力和Linux环境开发经验

申请策略

  • 申请前了解携程推荐系统的业务场景,面试时结合业务展示技术方案的思考
  • 强调学习能力和团队协作精神,因为该岗位需要和算法、运维等多团队紧密合作
  • 突出GPU相关项目经验,特别是CUDA kernel开发、推理加速或推荐系统优化的具体成果
  • 强调对推理框架(TensorRT/ONNX Runtime)的使用经验,并展示量化、融合等优化实践
  • 如果有开源贡献(如vLLM、FlashAttention)或MLSys相关论文/竞赛,务必重点列出
  • 深入学习CUDA编程模型和GPU体系架构,动手实现一些经典算子优化(如矩阵乘)
  • 熟悉TensorRT-LLM或vLLM等最新推理框架,了解PagedAttention、Continuous Batching等前沿技术

面试指南

  • 对于优化类问题:先明确优化目标(延迟/吞吐),然后分析瓶颈(计算/访存),再提出具体手段(算子融合、量化、访存优化等),最后举例说明效果
  • 对于知识类问题:先给出定义和原理,再联系实际应用场景,最后展示深度(如提到的进阶技术)
  • 请解释CUDA中的warp divergence及其对性能的影响,如何优化?
  • 描述一下TensorRT的图优化过程,你知道哪些优化pass?
  • 如何优化一个包含稀疏Embedding的推荐模型的推理延迟?
  • 你用Nsight进行性能分析的经验,如何定位瓶颈?
  • 说说你对FlashAttention或PagedAttention的理解,它们解决了什么问题?
  • 复习CUDA编程模型和GPU架构细节,准备一个完整的CUDA kernel优化案例

匹配度报告

64
综合匹配度

大厂AI Infra核心岗,前沿技术栈,薪资有竞争力,但现场办公且WLB未明确。

适合人群
最适合重视技术成长、追求高薪和前沿挑战的求职者,对工作生活平衡要求不高的人。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展85
工作生活30
使命价值60

薪资福利匹配

80较高

薪资在上海大厂中属于中上水平,但JD未提及额外福利,整体补偿性较好。

薪资信号偏高 (30K-50K/月)

成长发展匹配

85较高

技术栈前沿(GPU推理、LLM加速),且强调学习新技术,发展空间大,但未明确晋升通道。

技术前沿前沿/新兴技术
技术栈CUDA、TensorRT、ONNX Runtime、TVM、Triton、vLLM、FlashAttention、LLM
成长机会积极学习并参与新技术在团队内的落地
业务类型profit_center

工作生活匹配

30较低

仅现场办公,未提及弹性工作或WLB措施,生活方式灵活性较低。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

60中等

在线旅游行业稳定,AI推理助力业务增长有一定价值,但社会影响力一般。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

携程 的其他在招职位

  • 携程酒店业务BD/BDS(喀什)(MJ025239)

    携程 · 喀什地区
    AI 估算 · 8k-12k
  • 客服专员(老友会)(MJ034963)

    携程 · 上海市
    AI 估算 · 6k-9k
  • Quality Operations Specialist(MJ034980)

    携程 · 上海市
    AI 估算 · 18k-35k
  • 日本市场品牌营销运营(MJ034943)

    携程 · 上海市
    AI 估算 · 15k-25k
  • 签证订单产品经理(MJ034976)

    携程 · 上海市
    AI 估算 · 15k-25k

相似职位推荐

  • Unity客户端开发工程师-【游戏事业部】

    快手 · 广州市
    AI 估算 · 15k-30k
  • 前端研发实习生-【用户体验】

    快手 · 北京市
    AI 估算 · 4k-7k
  • JAVA开发-语音后端

    中国平安 · 深圳市
    AI 估算 · 35k-50k
  • 资深Agent算法工程师

    中国平安 · 深圳市
    AI 估算 · 30k-60k
  • 算法

    中国平安 · 上海市
    AI 估算 · 25k-45k

携程 的其他在招职位

  • 携程酒店业务BD/BDS(喀什)(MJ025239)

    携程 · 喀什地区
    AI 估算 · 8k-12k
  • 客服专员(老友会)(MJ034963)

    携程 · 上海市
    AI 估算 · 6k-9k
  • Quality Operations Specialist(MJ034980)

    携程 · 上海市
    AI 估算 · 18k-35k
  • 日本市场品牌营销运营(MJ034943)

    携程 · 上海市
    AI 估算 · 15k-25k
  • 签证订单产品经理(MJ034976)

    携程 · 上海市
    AI 估算 · 15k-25k

相似职位推荐

  • Unity客户端开发工程师-【游戏事业部】

    快手 · 广州市
    AI 估算 · 15k-30k
  • 前端研发实习生-【用户体验】

    快手 · 北京市
    AI 估算 · 4k-7k
  • JAVA开发-语音后端

    中国平安 · 深圳市
    AI 估算 · 35k-50k
  • 资深Agent算法工程师

    中国平安 · 深圳市
    AI 估算 · 30k-60k
  • 算法

    中国平安 · 上海市
    AI 估算 · 25k-45k