
普通员工/个人贡献者
AI 估算 · 35k–65k
大模型推理优化属于前沿技术方向,字节跳动薪资竞争力强,且要求高,预估月薪35k-65k
该职位负责构建和优化字节跳动语音大模型的推理引擎,涉及CUDA/Triton算子开发、vLLM/SGLang框架升级、分布式推理策略优化等,目标是实现低延迟、高吞吐的工业级部署
精通Python,熟悉C++特性,具备高性能代码开发能力和高性能代码开发相关经验
负责构建新一代大模型推理引擎并主导性能优化,涵盖CUDA/Triton算子开发、vLLM/SGLang框架升级、分布式推理策略优化、量化/稀疏化等模型效能加速技术,优化多模态语音理解/语音生成等多模态生成大模型在GPU集群上的推理性能,实现低延迟、高吞吐的工业级部署
加分项:
优点
缺点 / 挑战
前沿大模型推理优化岗位,薪资优厚、技术成长快,但工作强度较大。
字节跳动薪资福利优厚,该岗位技术稀缺,预计薪资水平偏高,补偿性动机满足度高。
涉及大模型推理前沿技术,有大量学习和成长空间,发展性动机满足度极高。
互联网大厂研发岗位,工作强度大,可能需加班,生活化动机满足度低。
推动AI技术落地,有一定技术影响力,但社会价值偏中立。