Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Nvidia logo
英伟达
AI Computing Development Engineer, TensorRT and TensorRT-LLM AIGV
立即应聘

AI Computing Development Engineer, TensorRT and TensorRT-LLM AIGV

发布于 大约 13 小时前

普通员工/个人贡献者

上海市 / 北京市
中级经验
全职员工
仅现场办公
硕士
软件工程
机器学习
GPU
深度学习
PyTorch
性能优化
AI推理
TensorRT
TensorRT-LLM

AI 估算 · 30k–50k

外企巨头AI核心岗位,硕士+2年经验,薪资竞争力强,月薪3-5万,年终1-2个月

职位详情

关于这个职位

加入NVIDIA AI计算团队,参与开发业界领先的推理加速引擎TensorRT及TensorRT-LLM,为全球深度学习应用提供高性能推理解决方案

你将接触最前沿的AI模型优化技术,与硬件、软件和研究团队紧密协作,推动GPU加速AI平台的创新
适合对AI推理优化充满热情、有扎实编程和深度学习框架经验的工程师

最低要求

计算机工程、计算机科学、应用数学或相关计算领域硕士及以上学历(或同等经验)

扎实的Python或C/C++编程和软件设计经验,包括调试、性能分析和测试设计
年以上工作经验
对人工智能有强烈好奇心,熟悉深度学习最新进展——包括生成模型、多模态系统和大型神经网络
有深度学习框架使用经验,如PyTorch、TensorRT/TensorRT-LLM、SGLang或vLLM
积极主动,自我驱动,能独立工作
优秀的英语书面和口头沟通能力
具备与技术经验相匹配的技术所有权能力、解决复杂问题的能力,并在跨职能环境中有效贡献

工作职责

设计并开发稳健的推理软件(TensorRT/TensorRT-LLM),针对跨平台功能和性能进行优化

对深度学习推理工作负载进行性能分析、优化和调优
跟踪并整合学术界和工业界在AI方面的进展,相应更新TensorRT/TensorRT-LLM功能
为架构和硬件设计开发提供反馈
与硬件、软件和研究团队协作,塑造NVIDIA平台上机器学习推理的方向
根据经验水平,负责从复杂功能到大型项目主要部分的技术交付,并随着时间推移增强独立性和技术领导力
在领先的科学和工程会议上发表关键技术成果

AI 洞察

优缺点分析

优点

  • 技术前沿:直接接触AI推理最核心的加速技术,与全球顶尖团队合作
  • 平台优势:NVIDIA是GPU与AI计算的领导者,产品影响力巨大,职业背书强
  • 成长空间:有机会参与从研究到落地的全流程,发表学术成果,技术成长快
  • 技术门槛高:需要深入理解深度学习模型和底层硬件架构,学习曲线陡峭
  • 工作节奏快:交付导向,需在快速迭代中保证软件质量和性能
  • 竞争激烈:内部人才密度高,需要持续学习保持竞争力

缺点 / 挑战

  • 适合对AI底层优化有强烈兴趣、享受挑战、具备扎实编程和深度学习基础的技术型求职者

角色解读

  • 技术深度方向:成为GPU推理优化专家,深入底层架构,发表顶会论文
  • 技术广度方向:横向扩展至整个AI软件栈(训练、部署),参与不同产品线
  • 技术领导方向:逐步承担更大模块的技术所有权,成长为技术负责人或架构师
  • 开发和优化NVIDIA核心推理引擎TensorRT/TensorRT-LLM,确保AI模型在GPU上高效运行
  • 对深度学习推理工作负载进行性能分析、调优,并跟踪最新AI进展集成到软件中
  • 与硬件、软件和研究团队协作,反馈架构改进,参与跨团队项目
  • 精通Python或C/C++,具备扎实的软件设计、调试和性能分析能力
  • 熟悉深度学习框架(如PyTorch)和推理库(TensorRT、vLLM等),理解生成式AI、多模态模型等前沿技术
  • 具备较强的独立解决问题和跨团队协作能力,英语沟通流利

申请策略

  • 在简历中清晰量化个人贡献(如降低延迟XX%、提升吞吐XX倍)
  • 面试前准备一个端到端的推理优化案例,包括问题分析、优化方案和结果
  • 突出深度学习推理优化经验,如使用TensorRT、ONNX Runtime等加速模型的具体项目
  • 强调C++/Python高性能编程能力,如多线程、SIMD、内存优化、性能调优案例
  • 展示对AI前沿技术的了解,如生成式AI、大语言模型、多模态等,体现技术热情
  • 如果没有TensorRT经验,建议先学习官方文档和示例,尝试优化一个简单模型
  • 提升GPU编程知识,如CUDA编程模型、GPU内存层次结构等
  • 阅读NVIDIA最新技术博客和会议论文,了解推理优化趋势

面试指南

  • 对于技术问题,采用STAR原则:背景、任务、行动、结果,突出量化成果
  • 对于开放性问题,先说明核心思路,再逐步细化,展示系统思维
  • 对于优化类问题,从宏观到微观:先分析瓶颈,再选择优化策略,最后验证
  • 请解释TensorRT的优化流程,如层融合、量化、动态形状处理等
  • 如何对一个PyTorch模型进行性能分析和瓶颈定位?你会使用哪些工具?
  • 在C++项目中,你如何处理内存管理以避免泄漏和提高性能?
  • 请描述你在深度学习推理加速中遇到的一个挑战及解决方法
  • 你对生成式AI中的推理优化有哪些了解?(如KV Cache优化、连续批处理)

匹配度报告

76
综合匹配度

AI推理优化前沿,高发展高回报,但需要接受较强的工作强度和现场办公

适合人群
最适合追求技术成长和行业影响力、愿意投入时间换取顶尖技能积累的求职者
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值80

薪资福利匹配

85较高

NVIDIA作为全球化AI巨头,薪资福利具有高度竞争力,但未明确透露具体数值,综合评估为市场偏上水平。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

职位深度涉及前沿推理技术栈,且有发表论文、技术领导力成长机会,发展性极强。

技术前沿前沿/新兴技术
技术栈TensorRT、TensorRT-LLM、GPU、深度学习推理、生成式AI
成长机会publish key technical results、technical leadership over time
业务类型profit_center

工作生活匹配

50较低

职位要求现场办公,未提及弹性工作,且NVIDIA通常要求较高的工作投入,WLB一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

80较高

推动AI推理前沿,赋能全球AI应用,技术价值和社会影响力显著,但未直接提及使命感。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

英伟达 的其他在招职位

  • Developer Technology Engineer – AI

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • Security and Safety Circuit Engineer

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • CPU Performance Developer Technology Engineer

    英伟达 · 上海市
    AI 估算 · 30k-50k
  • Deep Learning Performance Architect

    英伟达 · 上海市
    AI 估算 · 50k-80k
  • Senior System Software Engineer - GPU Performance Profiling Tools

    英伟达 · 上海市
    AI 估算 · 35k-55k

相似职位推荐

  • 系统软件研发实习生

    小米 · 武汉市
    AI 估算 · 4k-6k
  • 实习生-软件测试开发实习生

    阅文集团 · 上海市
    AI 估算 · 4k-6k
  • 混元训练 Infra 工程师-Dataloader/Checkpoint 方向-(北京/深圳/上海/杭州)

    腾讯 · 北京市
    AI 估算 · 30k-55k
  • 推荐算法实习生(MJ035505)

    携程 · 上海市
    AI 估算 · 4k-6k
  • FDE工程师(苏州)

    中国机械工业集团有限公司 · 苏州市
    AI 估算 · 12k-20k

英伟达 的其他在招职位

  • Developer Technology Engineer – AI

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • Security and Safety Circuit Engineer

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • CPU Performance Developer Technology Engineer

    英伟达 · 上海市
    AI 估算 · 30k-50k
  • Deep Learning Performance Architect

    英伟达 · 上海市
    AI 估算 · 50k-80k
  • Senior System Software Engineer - GPU Performance Profiling Tools

    英伟达 · 上海市
    AI 估算 · 35k-55k

相似职位推荐

  • 系统软件研发实习生

    小米 · 武汉市
    AI 估算 · 4k-6k
  • 实习生-软件测试开发实习生

    阅文集团 · 上海市
    AI 估算 · 4k-6k
  • 混元训练 Infra 工程师-Dataloader/Checkpoint 方向-(北京/深圳/上海/杭州)

    腾讯 · 北京市
    AI 估算 · 30k-55k
  • 推荐算法实习生(MJ035505)

    携程 · 上海市
    AI 估算 · 4k-6k
  • FDE工程师(苏州)

    中国机械工业集团有限公司 · 苏州市
    AI 估算 · 12k-20k