Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Nvidia logo
英伟达
AI Computing Software Development Engineer, LLM Inference
立即应聘

AI Computing Software Development Engineer, LLM Inference

发布于 大约 14 小时前

普通员工/个人贡献者

上海市 / 北京市
中级经验
全职员工
仅现场办公
硕士
软件工程
GPU
深度学习
PyTorch
性能优化
TensorFlow
LLM
CUDA
AI推理
TensorRT

AI 估算 · 30k–50k

英伟达在AI领域领先,职位技术要求高,薪资竞争力强,通常高于市场平均水平。

职位详情

关于这个职位

该职位负责开发TensorRT LLM推理加速软件,专注于优化GPU上的大语言模型推理性能

你将参与核心推理引擎的设计与实现,进行性能分析和调优,并跟踪学术界最新进展
适合对AI推理有浓厚兴趣、具备扎实C++和深度学习经验的工程师

最低要求

计算机工程、计算机科学、应用数学或相关计算方向硕士或更高学位(或同等经验)

年以上相关软件开发经验
优秀的C/C++编程和软件设计技能,包括调试、性能分析和测试设计
对人工智能有强烈好奇心,了解深度学习最新发展,如LLM、生成模型和推荐模型
有使用TensorFlow和PyTorch等深度学习框架的经验
积极主动,能独立工作
优秀的中英文书面和口头沟通能力

工作职责

设计和开发可在多个平台上扩展的鲁棒推理软件,实现功能和性能

进行性能分析、优化和调优
紧密跟踪人工智能和大语言模型领域的学术发展
为架构和硬件设计开发提供反馈
与公司内部协作,指导机器学习推理的方向,与软件、研究和产品团队合作
在科学会议上发表关键成果

AI 洞察

优缺点分析

优点

  • 英伟达是AI基础设施的领导者,你能接触到最前沿的GPU技术和AI推理栈
  • 团队工作直接影响到全球AI应用的性能,技术影响力大
  • 薪酬福利优厚,公司文化看重技术创新,鼓励发表论文
  • 技术深度要求高,需要同时掌握软件工程和AI算法知识
  • 跨团队协作频繁,对沟通能力和英语要求高

缺点 / 挑战

  • 工作节奏快,交付压力大,需要快速学习和产出
  • 适合对系统性能优化有热情、具备扎实C++和深度学习背景、喜欢挑战和技术前沿的工程师

角色解读

  • 技术深耕:成为AI推理领域的专家,参与下一代GPU架构设计
  • 跨团队发展:向深度学习全栈方向扩展,包括训练框架、编译器、模型优化
  • 技术领导力:带领小团队或项目,主导关键特性研发
  • 设计和开发TensorRT LLM推理软件,实现高性能的GPU推理引擎
  • 对现有推理系统进行性能分析和优化,包括内存、计算和通信瓶颈
  • 跟踪最新的AI研究,特别是LLM架构和推理加速技术,并将其转化为软件改进
  • 与硬件、研究和产品团队协作,推动推理技术方向的决策
  • 精通C/C++编程,具备系统级软件开发和调试能力
  • 深入理解深度学习框架(如PyTorch、TensorFlow)和GPU编程模型(CUDA)
  • 熟悉大语言模型(LLM)的推理流程和常见优化技术(如量化、剪枝、KV缓存)
  • 良好的性能分析工具使用经验(如NVIDIA Nsight、Profile等)

申请策略

  • 关注NVIDIA的技术博客和GTC演讲,展示对公司的了解
  • 面试中强调对性能优化的热情和系统性思维
  • 突出C++项目经验,特别是性能优化和系统级开发
  • 展示深度学习框架使用经验,尤其是模型部署或推理优化相关
  • 如果有LLM或GPU编程经验,务必详细描述
  • 强调学术背景与AI领域的相关性,如论文或开源贡献
  • 复习CUDA编程和GPU内存模型,熟悉TensorRT基本用法
  • 学习LLM推理优化技术(如FlashAttention、GPTQ等)

面试指南

  • 使用STAR方法回答行为问题:情境、任务、行动、结果
  • 技术问题:先明确问题定义,然后分步骤分析(瓶颈定位、优化方案、实验验证)
  • 系统设计问题:从架构层面考虑,权衡性能与可维护性
  • 如何优化一个LLM推理服务的延迟和吞吐量?
  • 解释TensorRT的工作原理,以及它如何加速深度学习推理
  • 你如何调试一个GPU程序的性能瓶颈?请给出具体步骤
  • 描述你过去参与的一个性能优化项目,挑战和结果是什么?
  • 你对LLM的最新趋势有什么了解?请举例说明

匹配度报告

78
综合匹配度

AI推理核心岗位,技术前沿、薪资优厚,但工作强度较大,WLB一般。

适合人群
最适合追求技术成长和前沿挑战的求职者,愿意在快节奏环境中工作。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活50
使命价值80

薪资福利匹配

85较高

英伟达作为顶级科技公司,薪资和福利极具竞争力,但职位描述未提及具体数字,需面试确认。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

95较高

职位涉及最前沿的LLM推理技术,技能成长空间极大,公司鼓励技术探索和发表成果。

技术前沿前沿/新兴技术
技术栈TensorRT、LLM、GPU、C++、PyTorch、TensorFlow、CUDA
成长机会在科学会议上发表关键成果、反馈到架构和硬件设计
业务类型profit_center

工作生活匹配

50较低

职位要求现场办公,节奏快,但未提及加班情况,灵活性一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

80较高

AI推理是当前技术热点,对推动AI发展有直接贡献,社会影响力较大。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号推动AI革命、构建GPU加速深度学习平台
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

英伟达 的其他在招职位

  • Solutions Architect - Financial Service

    英伟达 · 北京市
    AI 估算 · 35k-55k
  • Solution Architecture Intern, AI Infra - 2026

    英伟达 · 北京市
    AI 估算 · 6k-12k
  • Senior Supply Base Engineer

    英伟达 · 深圳市
    AI 估算 · 25k-45k
  • Senior Developer Relations Manager for DataBase and Data Processing

    英伟达 · 北京市
    AI 估算 · 40k-60k
  • Senior Developer Relations Manager - AI Algorithms, Datasets, and Benchmarks

    英伟达 · 北京市
    AI 估算 · 35k-55k

相似职位推荐

  • 顶尖实习-大模型推理加速研究员-AI平台-实习

    小米 · 北京市
    AI 估算 · 6k-10k
  • (实习生) 媒体引擎与高性能计算工程师

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 系统架构师(城配)

    顺丰速运 · 上海市
    AI 估算 · 30k-50k
  • 大模型算法工程师(销服)

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 测试开发工程师

    知乎 · 武汉市
    AI 估算 · 15k-25k

英伟达 的其他在招职位

  • Solutions Architect - Financial Service

    英伟达 · 北京市
    AI 估算 · 35k-55k
  • Solution Architecture Intern, AI Infra - 2026

    英伟达 · 北京市
    AI 估算 · 6k-12k
  • Senior Supply Base Engineer

    英伟达 · 深圳市
    AI 估算 · 25k-45k
  • Senior Developer Relations Manager for DataBase and Data Processing

    英伟达 · 北京市
    AI 估算 · 40k-60k
  • Senior Developer Relations Manager - AI Algorithms, Datasets, and Benchmarks

    英伟达 · 北京市
    AI 估算 · 35k-55k

相似职位推荐

  • 顶尖实习-大模型推理加速研究员-AI平台-实习

    小米 · 北京市
    AI 估算 · 6k-10k
  • (实习生) 媒体引擎与高性能计算工程师

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 系统架构师(城配)

    顺丰速运 · 上海市
    AI 估算 · 30k-50k
  • 大模型算法工程师(销服)

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 测试开发工程师

    知乎 · 武汉市
    AI 估算 · 15k-25k