
普通员工/个人贡献者
AI 估算 · 40k–65k
小红书一线大厂,大模型推理调度方向热门,高级工程师薪资具有竞争力,结合市场行情估算。
作为小红书大模型MaaS推理资源调度系统工程师,你将负责建设面向万亿级Token/日、万卡级异构GPU集群的推理调度系统,优化在线与离线负载混部、弹性伸缩和异构算力调度,在保障SLA的同时提升资源利用率、降低推理成本
有分布式系统、云原生、资源调度或高性能服务治理经验
万亿级 Token/日吞吐优化:围绕 QPS、RPM/TPM、并发、Token 吞吐、TTFT、TPOT延迟等指标,优化推理服务整体吞吐和资源效率
熟悉 AIBrix、llm-d、vLLM、SGLang、KServe、Ray Serve 等推理框架或服务化体系
优点
缺点 / 挑战
小红书核心AI基础设施岗,技术前沿、薪资高、成长快,但工作强度可能较大。
小红书作为一线大厂,薪资具有竞争力,福利完善,该职位属于核心部门,薪酬待遇较好。
该岗位涉及万亿级调度、前沿大模型推理技术,技术栈新,成长空间巨大,且有明确的指标优化要求,驱动深度学习。
职位要求现场办公,未提及弹性工作制;大厂核心岗位可能工作强度较高。
大模型推理调度是AI基础设施的关键环节,有技术推动行业进步的意义,但商业属性强,社会影响力中性。