Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型算法专家-Data
立即应聘

大模型算法专家-Data

发布于 大约 17 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
本科
PyTorch
MLOps
多模态
SFT
大模型
RL
DPO
LoRA

AI 估算 · 50k–80k

字节跳动高级算法岗位,大模型方向技术壁垒高,上海一线城市,薪资竞争力强,预估月薪5-8万。

职位详情

关于这个职位

加入字节跳动Data团队,负责大模型后训练算法的研究与开发,包括SFT、DPO、RL等,并推动Coding、翻译、多模态等垂直领域大模型的全流程研发

你将参与模型架构设计、数据处理、训练与评估,打造行业领先的大模型解决方案
适合有深度学习背景、对LLM技术有热情的高级算法工程师

最低要求

计算机科学、人工智能或相关专业本科及以上学历,具备3年以上机器学习或深度学习领域的研发经验

精通SFT、DPO、RL等大模型后训练算法原理,具备扎实的机器学习、深度学习理论基础,熟悉主流深度学习框架(如TensorFlow、PyTorch等),有丰富的模型训练与调优经验
对Coding、翻译、多模态等垂直领域大模型有深入理解,了解该领域的技术发展趋势和应用场景,有相关项目经验者优先
熟悉PyTorch与Hugging Face Transformers等主流深度学习框架,具备良好的代码编写规范和工程实践能力,能够独立完成复杂算法的代码实现
具有优秀的逻辑思维能力、问题解决能力和创新意识,能够快速学习和掌握新技术
良好的团队协作精神和沟通能力,能在跨部门协作中高效推进项目
了解基础的MLOps理念与工具,包括模型版本控制、关键指标监控、A/B测试及服务回滚策略

工作职责

负责SFT(监督微调)、DPO(直接偏好优化)、RL(强化学习)等大模型后训练算法的研究与开发,优化模型训练流程,提升模型在各类任务中的性能与表现,增强模型的泛化能力和适应性

负责Coding、翻译、多模态等垂直领域大模型的全流程研发工作,包括需求分析、模型架构设计、数据处理、模型训练与评估,打造贴合行业场景需求的专属大模型解决方案
探索并实践参数高效微调技术(如LoRA,QLoRA,Adapter Tuning等),在保证模型效果的同时,显著降低训练与部署成本
建立并完善模型评测体系,持续跟踪模型在多种下游任务中的表现,并推动模型快速迭代与上线部署
持续跟踪行业最新技术动态,结合公司业务需求,对现有大模型算法和垂直领域模型进行优化与迭代,解决模型训练和应用过程中的技术难题,提升模型的效率和质量
与业务团队紧密协作,深刻理解业务需求,推动模型能力与业务场景的深度融合,形成技术到价值的完整闭环

优先资格

拥有中文特定行业(如金融、法律、医疗)大模型后训练的实践经验

熟悉并实践过对齐技术,如DPO、KTO或RLHF
在模型安全、偏见与价值观对齐方面有深入研究或相关项目经验
具备工具或函数调用(Function Calling)相关能力的模型训练经验
熟悉检索增强生成(RAG)技术,并有结合后训练进行优化的经验

AI 洞察

优缺点分析

  • 字节跳动作为互联网巨头,在大模型领域投入巨大,能接触到业界顶级资源和数据
  • 职位聚焦前沿技术(RLHF、后训练),技术壁垒高,个人技能成长快
  • 薪资待遇优厚,且公司处于上市成熟期,福利完善
  • 大模型领域竞争激烈,技术迭代快,需要持续学习和高强度投入
  • 工作压力较大,可能面临严格的交付周期和频繁的版本迭代
  • 对算法和工程能力要求极高,需要同时具备科研创新和落地能力
  • 适合有3年以上深度学习经验,对大模型技术有浓厚兴趣,热爱钻研且能承受快节奏工作的算法工程师

角色解读

  • 可向大模型技术专家或技术负责人方向发展,带领团队攻克更前沿的算法难题
  • 在字节跳动可以接触到超大规模数据和算力,积累行业顶尖经验,未来可跳槽至其他大厂或创业
  • 技术方向可拓展至多模态、Agent、对齐研究等前沿领域,成为AI领域的领军人才
  • 负责大模型后训练算法的研究与开发,包括SFT、DPO、RL等,优化模型性能
  • 主导垂直领域大模型(Coding、翻译、多模态)的全流程研发,从数据处理到模型部署
  • 探索参数高效微调技术(如LoRA),降低训练成本,并建立模型评测体系推动迭代
  • 精通大模型后训练算法(SFT、DPO、RL),具备扎实的深度学习理论基础
  • 熟练使用PyTorch及Hugging Face Transformers,有丰富的模型训练与调优经验
  • 了解MLOps工具链,具备模型版本控制、监控、A/B测试等工程能力

申请策略

  • 关注字节跳动Data团队的技术博客和开源项目,面试时能体现对公司的了解
  • 准备好一个完整的项目案例,从问题定义、方案设计、实验对比到最终部署的全流程讲解
  • 突出大模型后训练(SFT、DPO、RL)的项目经验,详细描述技术细节和效果提升
  • 强调使用PyTorch/Hugging Face的工程实践,尤其是大规模分布式训练经验
  • 展示垂直领域(如Coding、翻译)的模型优化成果,最好有量化指标
  • 补充RLHF、DPO等对齐技术的理论基础和实践经验
  • 学习MLOps相关工具,如模型版本控制(DVC)、监控(Prometheus)等
  • 了解RAG、Function Calling等扩展技术,增加技术广度

面试指南

  • 结合理论和项目经验,先解释概念,再举例说明实际应用中的挑战和解决方案
  • 使用STAR法则(情境、任务、行动、结果)来结构化回答项目类问题
  • 对于开放性问题,先给出总体思路,再分点论述,最后总结
  • 请详细解释SFT和DPO的原理、区别以及适用场景
  • 在大模型训练中,你如何处理过拟合和灾难性遗忘?
  • 描述一次你使用LoRA进行微调的经历,如何选择秩和适配器位置?
  • 如何设计一个模型评测体系,确保多个任务上的公平比较?
  • 你对RLHF中的奖励模型有什么理解?如何避免奖励欺骗?

匹配度报告

71
综合匹配度

字节跳动大模型算法岗,前沿技术栈、薪资优厚,但工作强度大、WLB一般。

适合人群
最适合追求技术快速成长、高薪资回报、不介意高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值65

薪资福利匹配

85较高

字节跳动薪资处于行业顶尖水平,且上市后福利完善,补偿性动机满足度高。但JD未提及具体福利细节。

薪资信号未披露 (50K-80K/月)

成长发展匹配

95较高

该职位位于AI最前沿的大模型领域,技术栈先进,成长空间极大,发展性动机得到高度满足。

技术前沿前沿/新兴技术
技术栈SFT、DPO、RL、LoRA、Transformer、MLOps
业务类型profit_center

工作生活匹配

40较低

JD未提及弹性工作或远程,字节跳动互联网大厂通常工作强度大,生活化动机满足度较低。

工作模式未明确
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

65中等

大模型技术推动行业进步,但JD未强调社会使命,意义感动机中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 游戏关卡策划-绿洲

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • Android开发工程师-今日头条

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • AI/大模型网络研发工程师

    字节跳动 · 深圳市
    AI 估算 · 30k-60k
  • 抖音直播服务端核心研发工程师-游戏商业化方向

    字节跳动 · 广州市
    AI 估算 · 25k-45k
  • 大模型Agent研究工程师-Seed

    字节跳动 · 上海市
    AI 估算 · 30k-60k

相似职位推荐

  • 半导体激光器研发工程师

    浪潮 · 济南市
    AI 估算 · 15k-25k
  • 算法工程师(语音合成方向)

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • TMS Electric Component

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • 多模态大模型算法实习生(J97978)

    百度 · 北京市
    AI 估算 · 6k-10k

字节跳动 的其他在招职位

  • 游戏关卡策划-绿洲

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • Android开发工程师-今日头条

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • AI/大模型网络研发工程师

    字节跳动 · 深圳市
    AI 估算 · 30k-60k
  • 抖音直播服务端核心研发工程师-游戏商业化方向

    字节跳动 · 广州市
    AI 估算 · 25k-45k
  • 大模型Agent研究工程师-Seed

    字节跳动 · 上海市
    AI 估算 · 30k-60k

相似职位推荐

  • 半导体激光器研发工程师

    浪潮 · 济南市
    AI 估算 · 15k-25k
  • 算法工程师(语音合成方向)

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • TMS Electric Component

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • 多模态大模型算法实习生(J97978)

    百度 · 北京市
    AI 估算 · 6k-10k