小红书的大模型推理服务(MaaS)研发工程师/专家薪资是多少？

该职位薪资范围为 35k–70k（人民币/月）。

大模型推理服务(MaaS)研发工程师/专家的工作地点在哪里？

该职位工作地点位于北京市、上海市。工作形式为仅现场办公。

该职位要求学历未注明学历及高级经验工作经验。

🤖 AI 估测：¥35K-70K

发布时间：29 天前

这是一个专注于大模型推理服务（MaaS）研发的高级技术岗位

你将参与构建小红书万亿级Token量的大模型推理系统，负责智能网关、弹性伸缩、系统优化等工作，并探索负载感知的流量调度算法和国产异构算力的适配

核心目标是打造国内领先、稳定高效、成本经济的大模型API服务平台

参与小红书万亿级Token量推理系统构建，包括但不限于大模型智能网关、大模型弹性伸缩、推理系统优化等方向，共同打造国内领先的大模型MaaS服务

探索负载感知的推理系统流量调度算法，如基于Prefix Cache命中率调度、基于P/D分离的流量调度、基于KVCache使用率、推理排队负载感知的流量调度、长上下文请求调度优化等，持续提升MaaS系统的稳定性、成本效益

探索并跟进业界开源SOTA模型，如Qwen系列、DeepSeek系列，多维度评估模型效果并建立相关的准入体系，及时上架到MaaS系统

参与MaaS系统的国产卡适配与异构算力统一调度体系，如华为910C、阿里PPU、昆仑芯P800

参与攻克大规模分布式推理系统带来的复杂挑战，通过弹性调度、容量规划、链路压测等手段提升系统健壮性，确保平台能够弹性扩展，支撑业务的飞速增长

熟悉业界主流Dense、MOE大模型架构及主要特点，能识别出模型效果及主要使用场景，支持用户大模型的选型和使用需求

了解至少一种大模型服务推理部署框架，如vLLM、SGLang、Dynamo等，并有过大模型服务部署的经验

优秀的代码能力、数据结构和基础算法功底，熟悉C++/Python开发，熟悉 Linux/Git 开发环境

有强烈的工作责任心，较好的学习能力、沟通协作能力和自驱力，能和团队一起探索新技术，推进技术进步

有AI大模型网关相关方向研究或实操经验，如多模型路由、AI负载感知路由等

有大模型推理系统问题排查和优化经验，如推理的RT分析和优化

有国产主力卡型，如华为910C、阿里PPU、昆仑芯P800，性能评测或相关接入经验

大模型推理服务(MaaS)研发工程师/专家

🤖 AI 估测：¥35K-70K

发布时间：29 天前