小红书的大模型推理框架研发工程师/专家薪资是多少？

该职位薪资范围为 35k–70k（人民币/月）。

大模型推理框架研发工程师/专家的工作地点在哪里？

该职位工作地点位于北京市、上海市。工作形式为仅现场办公。

该职位要求学历未注明学历及高级经验工作经验。

🤖 AI 估测：¥35K-70K

发布时间：28 天前

该职位是小红书大模型基础设施团队的核心研发岗位，专注于构建高效、易用的大模型推理服务框架

你将负责研发面向LLM/MLLM的推理框架，优化分布式推理能力（如KV Router、KVCache管理），并构建系统容错能力，以支撑公司各业务线的AI技术高效落地

参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)等类型模型的推理服务框架

参与/负责KV Router、PD分离/EPD分离、KVCache管理、动态PD调整等分布式推理能力建设

通过并行计算优化、分布式架构优化、异构调度等多种框架技术，打造高效、易用、领先的AI推理框架

参与/负责构建推理框架的系统容错能力，包括但不限于请求迁移、优雅退出、故障检测、自愈等能力建设

深度参与周边深度学习系统多个子方向的工作，包括但不限于模型管理、推理部署、日志/监控、工作流编排等

与全公司各业务算法部门深度合作，为重点项目进行算法与系统的联合优化，支撑业务目标达成

优秀的代码能力、数据结构和基础算法功底，熟悉Rust/C++/python开发

熟悉至少一种主流的推理框架（Nvidia dynamo、vLLM、SGLang、AIBrix等）的原理和实现

有强烈的工作责任心，较好的学习能力、沟通能力和自驱力

良好的沟通协作能力，能和团队一起探索新技术，推进技术进步

大模型推理框架研发工程师/专家

🤖 AI 估测：¥35K-70K

发布时间：28 天前