Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型训练优化工程师-Seed
立即应聘

大模型训练优化工程师-Seed

发布于 大约 11 小时前

普通员工/个人贡献者

杭州市
中级经验
全职员工
仅现场办公
本科
软件工程
分布式系统
PyTorch
高性能计算
LLM
CUDA
RDMA
资源调度
TVM
大模型训练

AI 估算 · 30k–50k

大模型训练优化工程师属前沿技术岗位,字节跳动薪酬竞争力强,杭州生活成本低于北京,综合估算月薪3-5万。

职位详情

关于这个职位

该职位负责超大规模机器学习系统架构的设计与开发,与算法团队深度合作,优化大模型训练性能,涵盖分布式训练、高性能计算、数据管理等前沿技术方向,适合技术功底扎实、热爱挑战的工程师

最低要求

本科及以上学历,计算机、软件工程、人工智能等相关专业优先

工程或机器学习算法有深厚的功底和经验
历史上解决过难题,遇到难题时能静下心,具备攻坚克难的积极心态,能查到底层,观察敏锐,逻辑清晰
由衷热爱技术,有强烈的工作责任心,较好的学习能力、沟通能力和自驱力
良好的沟通协作能力,能和团队一起探索新技术,推进技术进步

工作职责

负责超大规模机器学习系统架构的设计开发,解决系统可扩展性、高可靠、可易用等关键技术

负责机器学习系统前瞻技术的调研和落地,以前瞻视角实现业界最佳的超大规模训练方案
与算法部门深度合作,进行算法与系统的联合优化,覆盖Pretrain、RL、新硬件适配等多个场景
覆盖机器学习系统多个子方向领域的工作,包括分布式模型训练、高性能计算、数据管理、资源调度等

优先资格

熟悉LLM、NLP、CV、语音相关的算法和技术,熟悉大模型训练、Diffusion、RL算法者优先

有以下某一方向领域的经验:高性能计算/CUDA,Torch.Compile/Triton/TVM等编译技术,RDMA/通讯库,异构加速硬件体系,分布式系统和大数据架构,系统算法联合优化

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,数据与算力充足,成长空间大
  • 团队技术氛围浓厚,与顶尖工程师合作,持续学习前沿技术
  • 技术更新快,需要持续学习新框架和硬件
  • 系统复杂度高,问题排查和优化难度大,需要耐心和深度思考

缺点 / 挑战

  • 接触超大规模训练场景,技术挑战大,能快速积累核心竞争力
  • 工作强度较高,可能面临紧急任务和快节奏迭代
  • 适合热爱技术、渴望挑战、具备扎实系统功底和自驱力的候选人

角色解读

  • 技术专家路线:深耕AI基础设施,成为分布式训练系统架构师
  • 管理路线:带领训练平台团队,负责技术方向和项目推进
  • 跨领域发展:向算法研究或硬件适配方向延伸,实现系统与算法协同创新
  • 设计和开发超大规模机器学习系统架构,解决可扩展性、高可靠性等关键技术问题
  • 与算法团队紧密协作,联合优化训练效率,涉及Pretrain、RL、新硬件适配等多个场景
  • 调研并落地前沿技术,如编译技术(Triton/TVM)、高性能计算(CUDA/RDMA)等
  • 扎实的分布式系统和机器学习算法基础,能独立解决复杂系统难题
  • 精通高性能计算和CUDA编程,有实际优化经验
  • 熟悉大模型训练框架(如Megatron、DeepSpeed)和常见优化策略
  • 较强的自驱力和学习能力,能快速掌握新技术

申请策略

  • 准备系统设计案例,展现从问题到落地的完整思路
  • 了解字节推荐、语音等业务场景,体现业务理解和技术结合
  • 突出分布式系统或高性能计算项目经验,强调性能优化成果(如加速比、吞吐提升)
  • 展示开源贡献或技术深度,如参与过CUDA库或训练框架改进
  • 体现算法与系统结合能力,例如联合优化经验
  • 强调问题解决能力,提供具体攻坚案例
  • 深入学习CUDA和GPU编程,掌握内存优化、算子调优技巧
  • 研究大模型训练框架(Megatron、DeepSpeed)和并行策略

面试指南

  • 先明确问题和约束条件,再提出多种方案并对比优劣,最后给出推荐方案和理由
  • 结合具体项目经历,说明问题背景、你的分析过程、具体措施和量化结果
  • 体现系统性思维,从算法、系统、硬件多角度思考问题
  • 如何设计一个支持千亿参数模型训练的分布式系统?
  • 请分享一个你用CUDA进行性能优化的具体案例
  • 在大模型训练中,如何解决内存瓶颈和通信开销问题?
  • 如何评估和选择不同的并行策略(数据并行、模型并行、流水线并行)?
  • 当训练出现异常(如loss不下降)时,你的排查思路是什么?

职位点评

64
综合评分

字节大模型训练优化岗,前沿技术栈,高成长但高强度。

更适合这类人
适合追求技术成长和前沿挑战,能够接受高强度工作的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利70
成长发展95
工作生活30
使命价值60

薪资福利

70中等

字节跳动薪资具有较强竞争力,但未在JD中明确福利,补偿性动机有一定满足。

薪资信号未披露(AI估算:30K-50K/月)

成长发展

95较高

该岗位聚焦前沿大模型训练技术,技术挑战大,能极大促进个人技能成长。

技术前沿前沿/新兴技术
技术栈大模型训练、CUDA、RDMA、LLM、分布式系统、高性能计算
业务类型ambiguous

工作生活

30较低

岗位需要高强度工作,办公模式未明确弹性,生活化动机满足度较低。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值

60中等

属于技术基础架构岗,对社会影响力直接体现有限,但行业增长迅速。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k