Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型后训练优化工程师-Seed
立即应聘

大模型后训练优化工程师-Seed

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
本科
分布式系统
PyTorch
高性能计算
系统架构
LLM
CUDA
算法优化
RDMA
机器学习系统
大模型训练

AI 估算 · 30k–60k

大厂核心岗位,大模型方向稀缺,技术难度高,薪资竞争力强,参考北京同级别市场水平。

职位详情

关于这个职位

该职位负责设计和优化超大规模机器学习系统,主要聚焦于大模型后训练阶段的效率与性能提升

你将与算法团队紧密合作,解决系统可扩展性、可靠性等关键技术问题,并参与前沿技术调研与落地
适合具有深厚工程或算法背景、热爱技术攻坚的资深工程师

最低要求

本科及以上学历,计算机、软件工程、人工智能等相关专业优先

具备工程或机器学习算法领域的深厚功底和算法相关经验
历史上解决过复杂技术难题,遇到问题能深入底层、敏锐观察、逻辑清晰,具备迎难而上的攻坚能力
由衷热爱技术,有强烈的工作责任心、优秀的学习能力与自驱力
具备良好的沟通协作能力,能与团队共同探索新技术、推进技术落地与迭代
对前沿技术保持敏感与持续关注,具备一定工程管理与流程优化能力,能推动项目高效落地

工作职责

负责超大规模机器学习系统架构的设计与开发,解决系统可扩展性、高可靠性、易用性等关键技术问题

负责机器学习系统前瞻技术的调研和落地,以前瞻视角实现业界领先的超大规模训练方案
与算法部门深度合作,进行算法与系统的联合优化,覆盖Pretrain、RL、新硬件适配等多个场景
负责机器学习基础框架与迭代脚手架的更新、重构与持续优化,提升研发效率与工程标准化水平

优先资格

熟悉LLM、NLP、CV、语音相关算法与技术,有大模型训练、Diffusion、RL算法相关经验者优先

有以下某一方向领域经验:高性能计算/CUDA、RDMA/通讯库,低精度/压缩/矩阵分解,存储和IO,异构加速硬件体系、分布式系统和大数据架构、系统算法联合优化
熟悉完整算法研发与训练流程,具备综合系统设计与整体方案规划能力者优先

AI 洞察

优缺点分析

优点

  • 字节跳动作为头部大厂,提供顶级平台和海量资源,技术视野开阔
  • 专注于大模型后训练优化,处于AI最前沿赛道,技能积累极具价值
  • 团队技术氛围浓厚,能与顶尖工程师和研究员深度协作,快速成长
  • 技术难度极高,需要同时具备系统和算法双重能力,学习曲线陡峭
  • 互联网大厂工作节奏较快,可能需要应对高强度开发和攻坚任务
  • 领域竞争激烈,需要持续跟踪前沿技术并快速迭代
  • 适合热爱技术、有强烈自驱力、喜欢解决复杂系统难题的资深工程师,尤其是对大模型训练优化有浓厚兴趣的人

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术专家路线:成为大模型训练优化领域的权威,引领技术方向
  • 架构师路线:负责更大规模系统设计,成为AI基础架构负责人
  • 可横向扩展至AI平台或芯片适配方向,进入AGI核心领域
  • 设计并开发超大规模机器学习系统架构,解决可扩展性、可靠性等核心技术难题
  • 调研并落地前沿训练技术,如新硬件适配、算法与系统联合优化
  • 与算法团队合作,覆盖Pretrain、RL等多个场景的训练优化
  • 持续重构和优化基础框架与迭代脚手架,提升研发效率
  • 深厚的计算机基础与算法功底,精通分布式系统和高性能计算
  • 熟悉CUDA、RDMA、低精度计算等系统优化技术
  • 具备大模型训练或相关框架(如PyTorch、Megatron)的实战经验
  • 优秀的复杂问题分析与攻坚能力,能深入底层解决问题

申请策略

  • 关注字节跳动Seed团队的公开技术博客和开源项目,在面试中展示对团队方向的了解
  • 提前梳理自己的技术栈与岗位的匹配点,准备有说服力的故事线
  • 突出大模型训练或分布式系统优化相关的项目经验,量化性能提升成果
  • 展示在CUDA、RDMA或高性能计算方面的具体贡献,如加速比、延迟降低等
  • 强调解决复杂技术问题的案例,体现攻坚能力和底层洞察
  • 如有算法背景,详细说明在Pretrain或RL训练中的参与角色与成果
  • 深入学习CUDA编程和GPU架构,掌握kernel优化技巧
  • 熟悉主流大模型训练框架(如DeepSpeed、Megatron-LM)的源码和原理

面试指南

  • 使用STAR法则:情境-任务-行动-结果,突出技术难点和个人贡献
  • 从系统角度分层次分析:硬件、网络、框架、算法,展示系统性思维
  • 强调数据驱动:用具体指标(如吞吐量、显存占用、训练时间)佐证优化效果
  • 请描述你参与过的最复杂的大模型训练优化项目,你如何分析并解决性能瓶颈?
  • 在大规模分布式训练中,如何优化通信效率?请结合具体技术方案说明
  • 你对CUDA kernel优化有哪些经验?请举例说明如何提升算子性能
  • 如果让你设计一个支持RL训练的新框架,你会考虑哪些关键设计?
  • 如何评估和应对训练中的内存不足问题?请给出系统级和算法级的策略

匹配度报告

70
综合匹配度

大厂核心前沿岗,技术天花板高,薪资丰厚,但工作强度大,WLB一般。

适合人群
最适合以技能成长和自我实现为核心驱动力,能接受高强度工作的技术人才。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展95
工作生活40
使命价值65

薪资福利匹配

80较高

字节跳动薪资竞争力强,大厂福利完善,但JD未明确具体薪资和福利,整体补偿性较好。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

95较高

职位涉及最前沿的大模型训练技术,有大量技术挑战和成长空间,与顶尖团队合作,发展性极强。

技术前沿前沿/新兴技术
技术栈LLM、大模型训练、CUDA、RDMA、分布式系统、高性能计算、RL、新硬件适配
业务类型ambiguous

工作生活匹配

40较低

JD未提及工作模式或WLB,大厂通常需较强投入,生活化动机满足度较低。

工作模式未明确
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

65中等

大模型技术处于高速增长赛道,对社会有潜在正面影响,但JD未强调使命感,意义感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务(常州)

    字节跳动 · 常州市
    AI 估算 · 8k-15k
  • 市场营销经理(汽车及泛高科技行业)-飞书

    字节跳动 · 上海市
    AI 估算 · 25k-40k
  • 巨量千川自助客户增长运营-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 大客户销售(零售行业)-抖音生活服务(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-40k
  • 高级C++开发工程师 - 飞书视频会议

    字节跳动 · 杭州市
    AI 估算 · 30k-50k

相似职位推荐

  • TMS System Design & Performance-3

    大众汽车 · 合肥市
    AI 估算 · 20k-35k
  • BiW Platform

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • Automated Parking Certification Engineer

    奔驰 · 北京市
    AI 估算 · 30k-50k
  • AI4S售前解决方案实习生(J99621)

    百度 · 北京市
    AI 估算 · 4k-7k
  • 用户研究实习生(J99720)

    百度 · 北京市
    AI 估算 · 4k-7k

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务(常州)

    字节跳动 · 常州市
    AI 估算 · 8k-15k
  • 市场营销经理(汽车及泛高科技行业)-飞书

    字节跳动 · 上海市
    AI 估算 · 25k-40k
  • 巨量千川自助客户增长运营-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 大客户销售(零售行业)-抖音生活服务(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-40k
  • 高级C++开发工程师 - 飞书视频会议

    字节跳动 · 杭州市
    AI 估算 · 30k-50k

相似职位推荐

  • TMS System Design & Performance-3

    大众汽车 · 合肥市
    AI 估算 · 20k-35k
  • BiW Platform

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • Automated Parking Certification Engineer

    奔驰 · 北京市
    AI 估算 · 30k-50k
  • AI4S售前解决方案实习生(J99621)

    百度 · 北京市
    AI 估算 · 4k-7k
  • 用户研究实习生(J99720)

    百度 · 北京市
    AI 估算 · 4k-7k