
普通员工/个人贡献者
AI 估算 · 40k–70k
高级大模型推理工程师岗位,技术难度高,字节跳动薪资竞争力强,北京地区月薪参考范围合理。
作为大模型推理优化工程师,你将负责构建和优化新一代大模型推理引擎,专注于多模态语音模型的GPU推理性能提升
精通Python,熟悉C++特性,具备高性能代码开发能力和算法相关经验
负责构建新一代大模型推理引擎并主导性能优化,涵盖CUDA/Triton算子开发、vLLM/SGLang框架升级、分布式推理策略优化、量化/稀疏化等模型效能加速技术,优化多模态语音理解/语音生成等多模态生成大模型在GPU集群上的推理性能,实现低延迟、高吞吐的工业级部署
符合以下条件者优先:拥有推理系统经验、具备vLLM/SGLang开发经验、Tilelang/Tritton开发经验,深入了解Transformer架构,有量化/稀疏化等相关技术落地或者论文发表等相关经验
优点
缺点 / 挑战
前沿技术、高薪酬、强成长,但工作强度大、WLB一般。
字节跳动提供有竞争力的薪酬和福利,但JD未明确说明具体福利细节,薪资估算在市场较高水平,补偿性动机满足较好。
该职位处于AI前沿技术领域,涉及大模型推理、CUDA、分布式等技术栈,成长空间极大,且字节跳动内部有完善的技术发展路径。
JD未提及工作模式和弹性办公,字节跳动通常要求现场办公且可能加班,WLB一般。
AI语音技术具有广阔应用前景,但职位本身偏底层优化,社会影响力中性,行业高速增长带来意义感。