腾讯的大模型推理后台开发工程师（深圳/北京/上海/杭州）薪资是多少？

该职位薪资范围为 35k–65k（人民币/月）。

大模型推理后台开发工程师（深圳/北京/上海/杭州）的工作地点在哪里？

该职位工作地点位于深圳市、北京市、上海市、杭州市。工作形式为仅现场办公。

该职位要求学历未注明学历及高级经验工作经验。

🤖 AI 估测：¥35K-65K

发布时间：大约 1 个月前

这是一个专注于大模型在线推理平台开发的后台工程师职位

你将负责设计并构建支撑亿级日调用量的高性能、高可用推理服务体系，优化服务性能与成本，并研发标准化的服务框架与工具链

该岗位是腾讯AI业务的核心技术基座，需要你具备扎实的后端研发功底和解决大规模推理服务技术挑战的能力

负责设计与演进业界领先的大模型在线推理平台，构建支撑亿级日调用量的高性能、高可用、高扩展的服务体系，为公司AI业务提供坚实的推理能力基座

负责设计高性能推理服务架构，结合推理引擎与底层硬件的核心特性，优化动态调度、资源管理等核心后台策略，实现服务性能与成本效益的最优化

负责研发标准化的推理服务框架与配套工具链，打通从模型研发、性能优化到线上部署的全链路流程，提升推理服务工程化落地效率

负责构建平台的高可用架构与可观测性体系，落地故障容灾、限流熔断等核心能力，为容量规划、应急响应提供数据与技术支撑，保障服务的可靠性

具备扎实的后端研发功底，熟练掌握 Golang/C++/Python 至少一门语言，对Linux环境下的分布式系统开发与挑战有深刻理解，具备复杂业务系统的设计与落地经验

具备解决大规模推理服务技术挑战的实践经验，尤其在状态感知的负载均衡、分布式推理的服务编排、长上下文管理或推理服务框架治理等方向有系统设计能力

具备出色的系统性思考和问题解决能力，能够从性能、成本、稳定性的全局视角进行技术选型与架构决策

具备以下一项或多项经验者优先：

1).有AI推理平台核心模块的设计与研发经验

2).具备vLLM等主流推理框架的服务集成与性能调优经验，并深入理解其架构原理

3).熟悉推理请求调度机制，并具备复杂场景（文本/多模态/流式）的服务设计经验

4).有大规模GPU推理集群治理、可观测性体系的实践经验

大模型推理后台开发工程师（深圳/北京/上海/杭州）

🤖 AI 估测：¥35K-65K

发布时间：大约 1 个月前