Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/元宝-LLM大模型推理工程师
Tencent logo
T
腾讯 (Tencent)

职位信息

北京市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

LLMCUDA模型量化TensorRT推理优化分布式推理
💡

核心评价

腾讯核心业务的前沿LLM推理技术岗,高成长高挑战,薪资竞争力强,但工作强度预期较高。

元宝-LLM大模型推理工程师

🤖 AI 估测:¥35K-60K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于LLM大模型推理优化与部署的工程师岗位
你将负责在腾讯的业务场景中,运用模型剪枝、量化、动态Batch等技术进行推理加速,并探索稀疏化、异构、分布式推理等前沿技术
该职位要求具备扎实的GPU编程和主流推理框架开发经验

✓工作职责

参与服务业务场景的llm大模型部署、运维、推理优化开发等相关工作
负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法
调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用

⭐最低要求

熟练掌握 C++/Python/Go语言,有2年以上llm大模型推理优化经验
具备基础的GPU编程能力,包括但不限于Cuda、OpenCL
熟悉至少一种GPU加速库,如cublas、cudnn等
有Tensorrt/Triton/sglang/vllm等推理框架的实际使用经验及二次开发经验
熟悉量化、剪枝、动态Shape、算子融合等优化方法的基本原理和适用场景
熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先
具备较强的抗压能力、团队协作和沟通能力,能够高效,完成项目交付和技术创新

👍优先资格

有超大模型分布式部署经验优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公