Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型后训练优化工程师-Seed
立即应聘

大模型后训练优化工程师-Seed

发布于 1 天前

普通员工/个人贡献者

杭州市
高级经验
全职员工
仅现场办公
本科
分布式系统
性能优化
系统架构
LLM
CUDA
算法优化
机器学习系统
RL
大模型训练

AI 估算 · 30k–60k

高级AI系统工程师,技术难度高,市场稀缺,公司平台大,薪资竞争力强。

职位详情

关于这个职位

该职位是字节跳动Seed团队的核心技术岗,负责超大规模机器学习系统的架构设计与优化,涉及大模型训练、强化学习等前沿技术

你将与算法团队深度合作,解决系统可扩展性、性能等关键问题,推动AI技术在豆包、即梦等产品中落地
适合热爱技术、有攻坚能力的高级工程师

最低要求

本科及以上学历,计算机、软件工程、人工智能等相关专业优先

具备工程或机器学习算法领域的深厚功底和算法相关经验
历史上解决过复杂技术难题,遇到问题能深入底层、敏锐观察、逻辑清晰,具备积极解决复杂问题的攻坚能力
由衷热爱技术,有强烈的工作责任心、优秀的学习能力与自驱力
具备良好的沟通协作能力,能与团队共同探索新技术、推进技术落地与迭代
对前沿技术保持敏感与持续关注,具备一定工程管理与流程优化能力,能推动项目高效落地

工作职责

负责超大规模机器学习系统架构的设计与开发,解决系统可扩展性、高可靠性、易用性等关键技术问题

负责机器学习系统前瞻技术的调研和落地,以前瞻视角实现业界领先的超大规模训练方案
与算法部门深度合作,进行算法与系统的联合优化,覆盖Pretrain、RL、新硬件适配等多个场景
负责机器学习基础框架与迭代脚手架的更新、重构与持续优化,提升研发效率与工程标准化水平

优先资格

加分项:

熟悉LLM、NLP、CV、语音相关算法与技术,有大模型训练、Diffusion、RL算法相关经验者优先
有以下某一方向领域经验:高性能计算/CUDA、RDMA/通讯库,低精度/压缩/矩阵分解,存储和IO,异构加速硬件体系、分布式系统和大数据架构、系统算法联合优化
熟悉完整算法研发与训练流程,具备综合系统设计与整体方案规划能力者优先

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,数据与算力强劲,能接触业界顶级项目
  • 团队氛围技术导向,鼓励创新和攻坚,有成就感
  • 系统复杂度高,问题定位和优化需要深入底层能力和耐心

缺点 / 挑战

  • 前沿AI大模型领域,技术挑战大,个人成长空间广阔
  • 工作强度较高,需要持续跟进前沿技术,学习压力大
  • 与算法团队紧密协作,沟通成本较高
  • 适合技术功底扎实、热爱挑战、有强自驱力和攻坚精神的工程师,希望在AI基础设施领域深耕

角色解读

  • 技术专家路线:深耕系统架构与优化,成为分布式训练或AI Infra领域权威
  • 架构师路线:主导大规模AI系统设计,推动技术演进
  • 管理路线:带领团队,负责核心系统研发和项目落地
  • 设计与开发超大规模机器学习系统架构,解决可扩展性、可靠性等关键技术问题
  • 调研并落地前沿的机器学习系统技术,实现业界领先的训练方案
  • 与算法团队深度合作,联合优化Pretrain、RL等场景的训练效率
  • 持续重构和优化基础框架与迭代工具链,提升工程标准化水平
  • 扎实的工程和机器学习算法基础,能够解决复杂技术难题
  • 深入理解分布式系统、高性能计算(如CUDA)和系统优化
  • 熟悉LLM、大模型训练流程及相关框架(如DeepSpeed、Megatron)
  • 具备良好的沟通协作能力和自我驱动力,热衷技术探索

申请策略

  • 关注字节跳动技术博客,了解Seed团队的技术方向和成果
  • 准备1-2个自己主导的系统设计或优化案例,展示系统思维
  • 突出参与过大模型训练或分布式系统相关的项目,量化优化成果(如训练速度提升XX%)
  • 展示解决复杂技术问题的案例,体现深入底层分析和逻辑清晰
  • 强调CUDA、高性能计算或系统架构设计经验
  • 体现团队协作和推动技术落地的能力
  • 补充LLM训练框架(如DeepSpeed、Megatron)的使用和原理
  • 学习RL算法及相关系统优化(如PPO训练)

面试指南

  • 采用STAR法则(情境-任务-行动-结果),清晰描述问题背景、具体行动和量化成效
  • 突出系统思维:从整体架构到具体优化点,展示权衡取舍
  • 注重与算法场景结合,体现对业务目标的理解
  • 请介绍你参与过的一个大规模分布式训练系统,你是如何设计架构的?
  • 在优化大模型训练性能时,你遇到的最大瓶颈是什么?如何解决的?
  • 你如何理解系统与算法的联合优化?请举例说明
  • 请谈谈你对CUDA编程和GPU性能优化的经验
  • 你如何看待当前大模型训练框架的优缺点?如何改进?

匹配度报告

70
综合匹配度

AI大模型前沿岗位,技术成长快,薪资竞争力强,但工作强度较大。

适合人群
适合追求技术成长和前沿领域、能接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展85
工作生活50
使命价值70

薪资福利匹配

75中等

字节跳动为上市巨头,薪资水平较高,但JD未明确具体薪资,补偿性满足度中等偏上。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

85较高

前沿大模型技术栈,系统复杂度高,成长空间大,但JD未明确晋升或培训机制,发展性满足度较高。

技术前沿前沿/新兴技术
技术栈机器学习系统、分布式系统、大模型训练、CUDA、RL、LLM
业务类型profit_center

工作生活匹配

50较低

仅现场办公,地点为科技园,JD未提WLB,工作强度可能较大,生活化满足度一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

致力于通用智能探索,有明确的社会贡献使命,但AI行业中性影响,意义感满足度中等偏上。

行业发展高速增长赛道
社会影响中性/一般
使命信号为科技和社会发展作出贡献
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k