Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
用户创作大模型算法工程师-智能创作(北京/上海)
立即应聘

用户创作大模型算法工程师-智能创作(北京/上海)

发布于 大约 14 小时前

普通员工/个人贡献者

北京市 / 上海市
中级经验
全职员工
仅现场办公
学历未注明
机器学习
强化学习
LLM
推荐系统
多模态
SFT
大语言模型
搜索系统
RLHF
对比学习

AI 估算 · 30k–60k

一线大厂算法岗,3年经验结合LLM方向稀缺性,薪资处市场中高位,竞争力强。

职位详情

关于这个职位

该职位属于字节跳动智能创作团队,负责将用户行为、偏好等信号引入大模型,优化个性化推荐与搜索系统

你将参与大模型后训练(SFT/RLHF)体系建设,基于用户在线反馈构建Reward信号,推动LLM和生成模型的持续迭代
适合对推荐系统、大模型、强化学习有深入研究的算法工程师

最低要求

扎实的编程能力,机器学习基础知识扎实,对解决具有挑战性问题充满激情

关心产品体验,逻辑感强,善于思考,数据与客观事实驱动,具备良好的工程与算法协作能力,积极主动、有责任感,能与团队高效沟通和合作
推荐/搜索/广告/机器学习相关背景,3年及以上算法相关工作经验,在个性化建模或推荐系统方向有扎实积累
在以下至少一个方向有深入研究或实战经验:
)搜索/推荐系统
)大语言模型(LLM)或多模态大模型
)个性化生成(Personalized Generation)
熟悉或参与过大模型后训练(Post-Training)流程,包括但不限于:
)SFT(Supervised Fine-tuning)
)Reward Model训练
)RLHF/RL-based Optimization
能够基于用户在线行为与反馈数据,构建有效的Reward/Preference信号,并将其用于LLM/生图模型的优化
对强化学习(RL)、对比学习、排序学习等方法有理解,并能将其应用于生成模型或推荐/搜索场景

工作职责

负责个性化计算与推荐/搜索系统的算法设计与优化,将用户行为、偏好、上下文等信号引入大模型与多模态模型中

参与大模型后训练(Post-Training)体系建设,包括但不限于SFT/Reward Modeling/RLHF/RLAIF
利用用户在线反馈(点击、停留、转化、偏好选择等)构建Reward信号,驱动LLM/多模态生成模型的持续优化
设计并实现基于强化学习(RL)或对比学习的优化策略,用于提升生成质量、用户满意度和业务指标
与产品、工程、运营等多团队合作,推动个性化大模型在真实业务场景中的落地和迭代

AI 洞察

优缺点分析

优点

  • 涉及大模型、强化学习等前沿技术,个人技能成长迅速
  • 薪资和福利在业界有竞争力,且团队技术氛围浓厚
  • 技术栈复杂,需要同时掌握推荐系统和大模型,学习曲线陡峭
  • 跨团队协作要求高,需与产品、工程、运营多方沟通协调

缺点 / 挑战

  • 字节跳动大平台,智能创作业务核心,技术挑战大、影响力广
  • 业务目标驱动,可能面临较大的交付压力与项目周期紧张
  • 适合具备推荐系统或大模型背景、热爱挑战、乐于将算法落地于实际产品的算法工程师

角色解读

  • 技术深度:从个性化算法专家发展为LLM/推荐系统领域的技术负责人
  • 管理方向:可晋升为技术Leader,带领团队负责算法方向规划与落地
  • 跨领域拓展:结合产品与业务,转向AI产品架构师或技术总监
  • 将用户行为、偏好等信号融入大模型和多模态模型,优化推荐与搜索系统的个性化效果
  • 参与大模型后训练流程,包括SFT、Reward Model训练、RLHF等,提升模型生成质量
  • 基于用户在线反馈(如点击、停留)构建Reward信号,驱动模型持续迭代
  • 设计强化学习或对比学习策略,应用于生成模型或推荐排序,并推动业务落地
  • 扎实的机器学习基础与编程能力(Python/C++等)
  • 深入理解推荐系统、搜索系统或广告系统,有3年以上相关经验
  • 熟悉大语言模型或多模态模型,掌握SFT、RLHF等后训练技术
  • 掌握强化学习、对比学习、排序学习等方法,并能在生成或排序场景应用

申请策略

  • 了解字节跳动智能创作业务(如剪映、轻颜等),在面试中展示对产品场景的理解
  • 可提前准备一个多模态与推荐结合的方案设想,体现思考深度
  • 重点突出推荐/搜索系统相关的项目经验,特别是个性化建模与效果提升的案例
  • 详细描述参与大模型后训练(如SFT、RLHF)的具体工作与成果
  • 强调利用用户反馈数据构建Reward信号并优化模型的经历
  • 展示编程能力与机器学习基础,可附上GitHub或技术博客
  • 若缺乏强化学习经验,可先学习基础理论并通过简单项目实践(如CartPole)
  • 深入理解LLM的后训练流程,尝试复现RLHF的经典论文

面试指南

  • STAR法则:描述场景、任务、行动、结果,突出个人贡献与量化指标
  • 技术原理+实践结合:先陈述理论基础,再说明在实际项目中的实现细节与效果
  • 问题解决思路:面对挑战时,系统分析可能原因,提出多种方案,最终选择并验证
  • 请介绍你参与过的一个推荐系统项目,如何优化个性化效果?
  • 解释RLHF的流程,以及如何设计Reward Model?
  • 如何利用用户点击行为构建处理信号用于大模型优化?
  • 对比学习在推荐或生成模型中的应用原理是什么?
  • 在训练大模型时遇到过哪些挑战?如何解决?

匹配度报告

74
综合匹配度

大厂核心算法岗,前沿技术栈,薪资优厚,但现场办公且WLB不明确。

适合人群
适合追求技术深度与前沿方向、对薪资和成长有较高期望,且能接受一定工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利匹配

85较高

字节跳动为上市公司,薪资在互联网大厂中属于头部水平,福利完善(五险一金、补充医疗、免费三餐等),但JD中未明确薪资数额,仅以面议为主,补偿性动机满足度较高。

薪资信号面议 (30K-60K/月)

成长发展匹配

90较高

职位涉及LLM、多模态、RLHF等前沿技术,团队技术氛围浓厚,个人成长空间大。JD中虽未直接提及培训或晋升通道,但大厂内部晋升体系成熟,且要求具备3年经验,属于技术深耕型岗位。

技术前沿前沿/新兴技术
技术栈大语言模型、多模态、RLHF、强化学习、对比学习、推荐系统、搜索系统
业务类型profit_center

工作生活匹配

50较低

仅现场办公,未提及远程或弹性工作,上海办公地点可能在市区或科技园,通勤有一定压力。JD中无WLB相关描述,互联网大厂算法岗通常加班较多。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

智能创作领域属于高速增长赛道,通过算法提升用户体验具有正向社会价值,但JD中未突出使命导向,主要聚焦技术实现。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 物流供应商管理专家-TikTok Shop

    字节跳动 · 珠海市
    AI 估算 · 25k-40k
  • 产品经理(广告信号方向)-国际商业化产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 消息队列产品经理-Data

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家产品运营高级经理-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • CRM产品经理(AI方向)-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-55k

相似职位推荐

  • 项目计划管理

    中国移动 · 长沙市
    AI 估算 · 8k-18k
  • 智能建模师

    中国移动 · 长沙市
    AI 估算 · 8k-15k
  • 大模型训练

    中国移动 · 长沙市
    AI 估算 · 3k-5k
  • 【REDstar】大模型 Efficient Inference Infra 工程师

    小红书 · 北京市
    AI 估算 · 30k-60k

字节跳动 的其他在招职位

  • 物流供应商管理专家-TikTok Shop

    字节跳动 · 珠海市
    AI 估算 · 25k-40k
  • 产品经理(广告信号方向)-国际商业化产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 消息队列产品经理-Data

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家产品运营高级经理-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • CRM产品经理(AI方向)-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-55k

相似职位推荐

  • 项目计划管理

    中国移动 · 长沙市
    AI 估算 · 8k-18k
  • 智能建模师

    中国移动 · 长沙市
    AI 估算 · 8k-15k
  • 大模型训练

    中国移动 · 长沙市
    AI 估算 · 3k-5k
  • 【REDstar】大模型 Efficient Inference Infra 工程师

    小红书 · 北京市
    AI 估算 · 30k-60k