Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型算法工程师-AI Coding(北京/上海/杭州/深圳)
立即应聘

大模型算法工程师-AI Coding(北京/上海/杭州/深圳)

发布于 大约 10 小时前

普通员工/个人贡献者

北京市 / 上海市
高级经验
全职员工
仅现场办公
学历未注明
NLP
数据挖掘
代码生成
知识蒸馏
VLM
ACM/ICPC
大模型(Llm)
强化学习(Rlhf/Ppo/Dpo)

AI 估算 · 35k–70k

字节跳动头部大厂,算法岗高薪,大模型方向稀缺,综合市场竞争力强,薪资水平偏高。

职位详情

关于这个职位

该职位负责研发提效场景下的大模型能力,包括数据挖掘、模型对齐、Agent训练等,探索下一代研发模式

你将参与高质量数据处理、模型优化(微调、强化学习、蒸馏)以及技术落地(如代码补全、漏洞检测)
适合有大模型实战经验、竞赛获奖或顶会论文背景的算法工程师

最低要求

优秀的代码能力、数据结构和基础算法功底,熟练掌握至少一门语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先

熟悉NLP、CV、ML等相关的技术,深入理解大模型相关技术栈(如Reward Model、GRPO/PPO/DPO、SFT/RFT、CT、PE等)
在大模型领域,主导过有影响力的项目或论文者优先
在ACL/EMNLP/ECCV/CVPR等顶会发表论文者优先
有代码基座经验,有强化学习结合大模型落地经验,有Multi-Agent、Tool-Use等相关经验优先
出色的问题分析和解决能力,有自主探索解决方案的能力
良好的沟通协作能力,能和团队一起探索新技术,推动技术进步

工作职责

负责研发提效场景所需要的大模型能力的研发和应用,研究高质量数据的挖掘和合成、大模型的对齐效率、Agent的设计&端到端训练等等,不断思考和跟进AI的最新进展对我们的价值,探索下一代的研发模式

高质量数据挖掘清洗使用,数据自动、半自动合成方案研究探索,设计针对代码场景的原子任务、全链路任务的评测方法
研究LLM/VLM训练与优化技术,包括微调、强化学习(RLHF)、知识蒸馏等,提高大模型在代码场景下的能力
尝试落地到各种应用场景,比如:IDE代码补全、代码能力QA、场景化Agent、代码自动修复、漏洞检测等等
持续跟踪LLM/VLM领域的最新技术动态,并将其应用于实际业务场景中,推动技术落地

AI 洞察

优缺点分析

优点

  • 字节跳动作为头部互联网公司,平台大、资源多,能接触到海量数据和高并发场景
  • 大模型方向是当前技术热点,职位含金量高,利于职业发展和技术积累
  • 团队技术氛围浓厚,有顶级会议论文发表机会,能快速提升科研和工程能力
  • 跨城市协调(北京/上海/杭州/深圳)可能带来沟通成本
  • 适合追求技术前沿、有强烈自驱力、热爱大模型和代码生成方向的算法工程师

缺点 / 挑战

  • 竞争激烈,要求高,需要持续跟进最新论文和技术,学习压力大
  • 工作强度较高,项目迭代快,可能需要应对紧急需求和版本发布

角色解读

  • 技术深耕:成为大模型算法专家,主导核心模型研发与创新
  • 技术管理:从IC向技术Leader发展,带领团队探索前沿技术
  • 全栈转型:结合工程化经验,转向AI系统架构或技术产品经理
  • 负责研发提效场景的大模型能力,包括数据挖掘、模型训练与优化,以及Agent设计
  • 研究高质量数据的自动合成和清洗,设计代码场景的评测方法
  • 将大模型技术落地到IDE代码补全、漏洞检测等实际产品中,推动工程化应用
  • 扎实的编程能力(Python/C++等)和算法功底,竞赛获奖者优先
  • 深入理解NLP、CV、大模型技术栈(如强化学习、SFT、蒸馏等)
  • 有大模型项目或顶会论文经验,熟悉代码基座、Agent、Tool-Use等方向

申请策略

  • 在简历中附上GitHub链接或技术博客,展示代码能力和技术思考
  • 面试前了解字节跳动在AI Coding方向的产品(如豆包、MarsCode),提前准备相关问题
  • 突出大模型项目经验,尤其是强化学习(RLHF/PPO/DPO)、微调、数据合成等方向的实际案例
  • 强调竞赛获奖(ACM/ICPC等)或顶会论文(ACL/CVPR等),证明算法和科研能力
  • 展示代码基座、Agent、Multi-Agent、Tool-Use等具体落地经验
  • 深入理解GRPO/PPO/DPO等强化学习算法,并尝试复现最新论文
  • 学习代码生成领域的前沿技术,如Code Llama、StarCoder等模型的应用
  • 提升工程能力,熟悉云平台(如火山引擎)和分布式训练框架

面试指南

  • STAR法则(Situation-Task-Action-Result):结构化描述项目经历,突出个人贡献和技术深度
  • First Principles Thinking:从基本原理出发,推导解决方案,展示逻辑和创新能力
  • W1H(Why-What-Where-When-Who-How):全面分析问题,体现系统思维
  • 请详细介绍你参与的大模型项目,包括数据、模型、训练策略和效果
  • 如何设计一个针对代码补全任务的评测数据集?
  • 解释PPO算法的原理,在代码生成场景中如何应用?
  • 你如何处理大模型训练中的过拟合和灾难性遗忘问题?
  • 请描述一个你解决过的复杂技术问题,思路和步骤是什么?

匹配度报告

71
综合匹配度

大厂高薪、前沿技术栈、成长空间极大,但工作强度和竞争压力较大。

适合人群
适合以技术成长和薪资为首要目标,能接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利匹配

85较高

字节跳动薪资具有市场竞争力,大模型算法岗属于高薪方向,福利完善,但存在加班文化。

薪资信号偏高 (35K-70K/月)

成长发展匹配

90较高

该职位能接触前沿大模型技术,有大量实践机会,团队鼓励发表论文和探索新技术,成长空间大。

技术前沿前沿/新兴技术
技术栈LLM、VLM、RLHF、PPO、DPO、GRPO、SFT、知识蒸馏、Agent、Multi-Agent、Tool-Use
成长机会持续跟踪最新技术动态、探索下一代研发模式
业务类型profit_center

工作生活匹配

40较低

字节跳动工作强度较大,需现场办公,未提及远程或弹性工作,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况JD含高强度暗示词

使命价值匹配

70中等

AI Coding方向具有技术价值,能提升研发效率,但属于商业驱动,社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 消息中间件产品开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 番茄系内容运营-音乐

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 基础框架产品-红果短剧

    字节跳动 · 深圳市
    AI 估算 · 20k-35k
  • XR系统应用开发工程师-移动OS

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • UX设计师-飞书文档

    字节跳动 · 深圳市
    AI 估算 · 15k-30k

字节跳动 的其他在招职位

  • 消息中间件产品开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 番茄系内容运营-音乐

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 基础框架产品-红果短剧

    字节跳动 · 深圳市
    AI 估算 · 20k-35k
  • XR系统应用开发工程师-移动OS

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • UX设计师-飞书文档

    字节跳动 · 深圳市
    AI 估算 · 15k-30k