
普通员工/个人贡献者
AI 估算 · 35k–65k
大模型方向热门,字节跳动薪资竞争力强,专家级岗位需丰富经验,薪资处于市场高位。
作为字节跳动 Seed 团队的训练稳定性专家,你将负责超大规模分布式训练集群的稳定性架构设计与优化,主导容错机制研发,确保大模型训练的高效稳定运行
本科及以上学历,计算机、软件工程、人工智能、电子信息、微电子等相关专业优先
训练稳定性体系搭建与架构优化:负责超大规模分布式训练集群的稳定性架构设计与迭代,定义可量化的稳定性指标,梳理全链路稳定性风险点,建立覆盖全流程的稳定保障体系
熟悉Megatron-LM、DeepSpeed、PyTorch等主流训练框架原理和实现
优点
缺点 / 挑战
顶级大厂AI核心岗位,前沿技术栈,薪资优厚,但工作强度较大。
薪资水平具有竞争力,但JD未明确提及福利,结合大厂背景福利较完善。
职位涉及大模型前沿技术,有大量技术挑战和成长空间,JD未明确提及晋升,但大厂有明确通道。
JD未提及办公灵活性,字节跳动通常要求较高投入,WLB一般。
属于AI核心赛道,对社会有较大影响,但JD未强调使命价值。