Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/混元大模型推理研发高级工程师(深圳/北京/上海/杭州)
Tencent logo
T
腾讯 (Tencent)

职位信息

广东省-深圳市 / 北京市 / 上海市 / 浙江省-杭州市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

分布式系统深度学习GPU优化CUDA性能调优TensorRT大模型推理
💡

核心评价

腾讯大厂核心AI岗,技术前沿成长快,薪资竞争力强,但工作地点固定且可能需高强度投入。

混元大模型推理研发高级工程师(深圳/北京/上海/杭州)

🤖 AI 估测:¥35K-65K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型推理系统研发的高级技术岗位
你将负责与算法团队协作,将深度学习算法落地为高吞吐、低延迟的推理服务,并持续优化推理框架的性能与成本
核心工作围绕GPU编程、推理引擎优化和分布式部署展开,是AI工程化领域的关键角色

✓工作职责

配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统
优化大模型推理性能,提升吞吐并控制成本
优化大模型推理框架,提升框架易用性和可调试性

⭐最低要求

熟练掌握 C/C++、Python语言,有计算机体系结构背景或软件开发背景,熟悉系统性能调优的方式
具备基础的GPU编程能力,包括但不限于Cuda、OpenCL,熟悉至少一种GPU加速库,如cublas、cudnn、cutlass等
具备Tensorrt/FasterTransformer/Tensorrt-llm/vllm/sglang等推理引擎的使用和性能优化经验
熟悉各类深度学习网络和算子底层实现细节,具备训推模型调试、调优实操经验优先
熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI 芯片、GPU加速经验优先
熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先

👍优先资格

具备训推模型调试、调优实操经验优先
有服务器端 AI 芯片、GPU加速经验优先
有超大模型分布式部署经验优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公