
普通员工/个人贡献者
AI 估算 · 30k–60k
大模型推理infra工程师技能稀缺,小红书业务规模大,薪资具有竞争力,参考一线互联网大厂同级别薪资水平。
这是一个专注于大模型推理基础设施的工程师岗位,你将参与高性能推理框架、模型压缩和分布式推理系统的研发,面对千卡级训练、高并发推理等大规模AI Infra挑战
具备扎实的代码能力、数据结构和基础算法功底,熟悉 Rust / C++ / Python 中至少一门语言,具备良好的工程实现能力和代码质量意识
推理框架研发: 参与 rLLM 推理框架研发,支撑 LLM、MLLM、DiT 等模型的高性能在线推理
参与过 vLLM、SGLang、TensorRT-LLM、Nvidia Dynamo、AIBrix 等主流推理框架的代码贡献或核心模块开发
优点
缺点 / 挑战
前沿技术栈、高成长性,但工作强度可能较大,适合技术驱动的候选人。
大模型Infra工程师薪资水平较高,小红书作为快速增长的互联网公司,薪资福利有竞争力,但JD未明确具体福利内容。
该职位技术栈前沿,涉及当前最热门的大模型推理和压缩技术,团队有开源项目,成长空间巨大。
工作地点在北京/上海核心地段,但JD未明确办公模式或WLB信息,互联网公司高强度工作可能性较大。
AI大模型是高速增长赛道,技术影响力大,但JD未突出社会使命,主要强调技术价值。