
字节跳动
大模型算法工程师(社交互动方向)-抖音直播
大模型算法工程师(社交互动方向)-抖音直播
发布于 1 天前普通员工/个人贡献者
上海市
初级经验
全职员工
仅现场办公
本科
NLP
PyTorch
强化学习
多模态
大语言模型
RLHF
ChatGLM
Reward Model
AI 估算 · 30k–60k
大模型方向人才稀缺,字节跳动薪资竞争力强,上海生活成本高,综合市场行情估算。
职位详情
关于这个职位
该职位负责抖音社交互动方向的大语言模型和多模态大模型算法研发,核心目标是通过AI技术提升聊天活跃度、促进社交关系并沉淀社交资产
你将参与社交大模型的Post-training,运用强化学习、生成式Reward模型等技术突破模型共情能力,同时搭建具备多模态感知和长期记忆的社交智能体
这是一个将前沿AI技术直接落地到亿万用户产品的机会
最低要求
计算机、人工智能、模式识别等相关专业本科及以上学历
熟悉Linux系统和常用的数据结构,熟练使用Python/C++等至少一种编程语言,熟练使用TensorFlow/PyTorch等至少一种深度学习框架
具有1年以上NLP研究或项目经验,熟悉Attention、Transformer、BERT、GPT等常用模型结构,熟悉Llama、ChatGLM等开源大模型原理与实现
优秀的分析和解决问题的能力,对解决具有挑战性的问题充满激情,良好的沟通和团队合作能力
工作职责
负责抖音社交互动方向的大语言模型/多模态大模型的算法研发,利用AI赋能社交,提升聊天活跃度、促进社交关系、沉淀社交资产,重构用户社交链路与互动体验,包括但不局限于消息会话、合养精灵、群聊等场景
负责社交大模型的Post-training,通过强化学习、生成式Reward模型、用户反馈系统等技术突破大模型交互共情能力的天花板
负责社交智能体的搭建,提供多模态的感知、互动能力及长期记忆系统,为用户提供极致的个性化体验
跟踪AI前沿技术进展,推动前沿技术的产品化落地
优先资格
在代码生成、大模型训练、Agent、RLHF等方面有积累者
AI 洞察
优缺点分析
优点
- 参与前沿大模型技术在亿级用户产品中的落地,积累高价值的实战经验
- 字节跳动技术氛围浓厚,资源丰富,可与顶尖AI人才共事
- 社交互动方向是抖音核心功能,项目重要性高,成长空间大
- 社交场景对模型共情能力和实时性要求高,技术难度大
- 互联网大厂工作节奏较快,可能需要应对高强度研发周期
缺点 / 挑战
- 大模型训练和调优对计算资源消耗大,需应对工程化挑战
- 适合1-3年NLP经验、对大模型充满热情、希望深入算法前沿并愿意承担挑战的工程师
角色解读
- 技术纵深:从算法工程师成长为NLP/大模型专家,深入底层模型训练与优化
- 产品导向:结合社交场景,转向AI产品架构师,负责产品级AI方案设计
- 管理路线:积累经验后晋升为技术Lead或团队负责人,带领算法团队
- 研发大语言模型和多模态模型,应用于抖音社交场景(如消息会话、群聊),提升用户互动体验
- 通过强化学习、Reward模型等技术进行模型Post-training,优化社交大模型的共情能力
- 搭建社交智能体,集成多模态感知、互动能力及长期记忆系统,实现个性化交互
- 跟踪NLP/AI前沿技术,推动技术产品化落地,与产品、工程团队紧密协作
- 扎实的NLP基础,熟悉Transformer、BERT、GPT等模型结构,以及Llama、ChatGLM等开源大模型原理
- 熟练使用Python/C++及深度学习框架(PyTorch/TensorFlow),具备Linux系统开发能力
- 有强化学习、RLHF、Reward Model或Agent相关经验者优先
- 优秀的分析和解决问题能力,能够独立完成算法设计与实验
申请策略
- 在简历中量化成果(如提升指标X%),并准备一段自我介绍,突出你对社交+AI的理解
- 了解抖音社交功能(如合养精灵、群聊),思考AI如何优化这些场景
- 突出NLP/CV项目经验,特别是大模型相关(如微调、RLHF、Agent等)
- 展示代码能力(GitHub链接或开源贡献),尤其是Python和PyTorch项目
- 强调问题解决和团队协作案例,例如在项目中如何优化模型效果
- 补充强化学习、Reward Model和RLHF的理论与实践,可阅读相关论文或复现开源项目
- 熟悉至少一个开源大模型(如LLaMA、ChatGLM)的代码和训练流程
面试指南
- 技术问题:先阐述核心原理,再结合实际应用,举例说明优缺点
- 项目问题:使用STAR原则(情境-任务-行动-结果),突出你的贡献和思考
- 开放性问题:以“目标-方法-评估”逻辑展开,展示结构化思维
- 请解释Transformer的Self-Attention机制,以及为什么能解决长距离依赖?
- 你如何设计一个RLHF训练流程?Reward Model如何训练?
- 描述一个你参与的大模型项目,包括目标、方案、挑战和最终效果
- 在社交场景下,如何评价模型生成内容的共情能力?有哪些评估指标?
- 你对开源模型(如LLaMA、ChatGLM)的结构有何理解?如何针对社交任务进行微调?
匹配度报告
64
综合匹配度
字节大模型算法岗,前沿技术、高成长,但WLB一般、薪资未明。
适合人群
适合高度追求技术成长和前沿项目、对工作生活平衡要求不高的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展85
工作生活40
使命价值60
薪资福利匹配
70中等
字节跳动薪资具有竞争力,但JD未明确薪资范围,福利情况未知;上海地区生活成本高,综合薪资待遇处于市场中上水平。
薪资信号未披露(AI估算:30K-60K/月)
成长发展匹配
85较高
该职位处于大模型前沿技术领域,能接触RLHF、Agent等最新方法,并实际落地到亿级产品,技术成长空间极大。但JD未提及明确的晋升通道或培训机制。
技术前沿前沿/新兴技术
技术栈大语言模型、多模态、强化学习、RLHF、Reward Model、Agent、Transformer、GPT
业务类型ambiguous
工作生活匹配
40较低
仅现场办公,地点上海,未明确说明WLB或弹性工作,互联网大厂通常节奏较快,加班可能较多。
工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)
使命价值匹配
60中等
AI技术应用于社交互动,具有一定的社会价值(促进连接),但整体属于商业化产品,使命感一般。行业处于高速增长期。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
字节跳动 的其他在招职位
相似职位推荐
Watch Jobs