Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/大模型推理后台开发工程师(深圳/北京/上海/杭州)
Tencent logo
T
腾讯 (Tencent)

职位信息

广东省-深圳市 / 北京市 / 上海市 / 浙江省-杭州市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

分布式系统系统架构可观测性GPU集群高性能服务vLLM大模型推理
💡

核心评价

腾讯大厂核心AI岗,前沿技术挑战大,成长空间广阔,薪资竞争力强,WLB预期一般。

大模型推理后台开发工程师(深圳/北京/上海/杭州)

🤖 AI 估测:¥35K-65K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型在线推理平台开发的后台工程师职位
你将负责设计并构建支撑亿级日调用量的高性能、高可用推理服务体系,优化服务性能与成本,并研发标准化的服务框架与工具链
该岗位是腾讯AI业务的核心技术基座,需要你具备扎实的后端研发功底和解决大规模推理服务技术挑战的能力

✓工作职责

负责设计与演进业界领先的大模型在线推理平台,构建支撑亿级日调用量的高性能、高可用、高扩展的服务体系,为公司AI业务提供坚实的推理能力基座
负责设计高性能推理服务架构,结合推理引擎与底层硬件的核心特性,优化动态调度、资源管理等核心后台策略,实现服务性能与成本效益的最优化
负责研发标准化的推理服务框架与配套工具链,打通从模型研发、性能优化到线上部署的全链路流程,提升推理服务工程化落地效率
负责构建平台的高可用架构与可观测性体系,落地故障容灾、限流熔断等核心能力,为容量规划、应急响应提供数据与技术支撑,保障服务的可靠性

⭐最低要求

具备扎实的后端研发功底,熟练掌握 Golang/C++/Python 至少一门语言,对Linux环境下的分布式系统开发与挑战有深刻理解,具备复杂业务系统的设计与落地经验
具备解决大规模推理服务技术挑战的实践经验,尤其在状态感知的负载均衡、分布式推理的服务编排、长上下文管理或推理服务框架治理等方向有系统设计能力
具备出色的系统性思考和问题解决能力,能够从性能、成本、稳定性的全局视角进行技术选型与架构决策

👍优先资格

具备以下一项或多项经验者优先:
1).有AI推理平台核心模块的设计与研发经验
2).具备vLLM等主流推理框架的服务集成与性能调优经验,并深入理解其架构原理
3).熟悉推理请求调度机制,并具备复杂场景(文本/多模态/流式)的服务设计经验
4).有大规模GPU推理集群治理、可观测性体系的实践经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公