Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
算法工程师-大模型数据
立即应聘

算法工程师-大模型数据

发布于 大约 4 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
学历未注明
数据挖掘
数据处理
自然语言处理
计算机视觉
LLM
VLM
大模型
具身智能

AI 估算 · 30k–55k

大模型方向热门,字节算法岗薪资具有竞争力,上海消费高,月薪30-55K合理。

职位详情

关于这个职位

该职位负责大模型训练数据的全链路建设,从网页、文档、视频等源头解析处理多模态数据,并构建质量评估体系

你将参与VLM、LLM、Agent等前沿大模型的数据工作,推动AGI数据发展,适合对数据敏感、技术扎实的算法工程师

最低要求

熟悉大模型相关技术,或者NLP、CV等相关领域技术

编程基本功扎实、熟悉常用数据结构和算法,有大规模数据处理的经验
熟悉常见的大模型结构,掌握相关的大模型基础知识

工作职责

从公开网页、文档、视频等源头解析、处理、合成得到视觉、文本、语音等多模态的训练数据,并验证其价值

建设端到端的训练数据的质量、多样性评估体系,参与全链路的效果优化,不断提升数据质量和多样性
参与VLM、LLM、Agent、具身智能等多个前沿大模型基座的数据工作
跟进大模型数据领域的前沿技术,推动AGI数据建设

优先资格

有大模型预训练经验者优先

Prompt Engineering解决各类问题经验丰富者优先

AI 洞察

优缺点分析

优点

  • 字节跳动平台大,数据资源丰富,能接触前沿大模型技术
  • 大模型数据方向稀缺,技术积累含金量高,未来跳槽竞争力强
  • 参与多模态、Agent等前沿领域,发展空间大
  • 薪资待遇优厚,福利较好
  • 对数据质量和效果要求极高,需要持续优化和实验
  • 大模型领域更新快,需要不断学习新技术
  • 适合对数据敏感、技术扎实、热爱大模型方向的算法工程师,能承受快节奏工作

缺点 / 挑战

  • 工作强度较大,可能面临高压力和快速迭代的节奏

角色解读

  • 在大模型数据方向深耕,成为数据专家或科学家
  • 向大模型训练或算法落地方向发展,覆盖更多模型技术
  • 未来可转型为算法负责人或技术Leader,负责团队管理
  • 从公开网页、文档、视频等源头解析、处理、合成多模态训练数据,并验证数据价值
  • 建设数据质量和多样性的评估体系,优化全链路效果,提升数据质量
  • 参与VLM、LLM、Agent、具身智能等前沿大模型的数据工作
  • 跟进大模型数据领域前沿技术,推动AGI数据建设
  • 熟悉大模型技术、NLP或CV,编程基础扎实,熟悉数据结构和算法
  • 具备大规模数据处理经验,了解常见大模型结构和基础知识
  • 有预训练经验或Prompt Engineering经验者优先
  • 对数据质量评估和多样性有深入理解

申请策略

  • 关注字节跳动大模型进展,在面试中展现对AGI数据建设的热情
  • 准备一个完整的数据处理项目故事,从问题到解决方案效果
  • 突出大模型或NLP/CV项目经验,特别是数据处理和训练相关经历
  • 强调大规模数据处理的工程能力,如Hadoop/Spark、分布式等
  • 展示预训练或Prompt Engineering的成果,如论文、开源贡献
  • 量化数据质量提升的效果,如准确率提升、数据量等
  • 熟悉主流大模型结构(GPT、LLaMA、VLM等)和数据流程
  • 提升编程和数据处理效率,学习相关工具(如TensorFlow、PyTorch)

面试指南

  • 采用STAR法则,情境-任务-行动-结果,突出数据量和效果
  • 技术问题回答要结构化,从问题定义、方法选择、实验验证
  • 结合业务场景,体现对数据价值和模型效果的理解
  • 如何设计大模型训练数据的质量评估体系?
  • 描述一个你处理大规模数据的项目,遇到哪些挑战?
  • 对于多模态数据(如图文、视频)如何处理?
  • 你如何判断数据多样性是否足够?
  • 谈谈你对当前大模型数据策略的看法

匹配度报告

72
综合匹配度

字节大模型数据技术岗,前沿技术栈,薪资优厚,但WLB一般,工作强度较大

适合人群
适合追求技术前沿、快速成长、愿意投入高强度工作的求职者
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值85

薪资福利匹配

75中等

字节跳动薪资在行业中属上等,但JD未明确薪资和具体福利,稳定性高但工作强度可能影响满意度。

薪资信号未披露(AI估算:30K-55K/月)

成长发展匹配

90较高

该职位涉及最前沿的大模型技术,与AGI目标一致,个人成长空间极大,且字节内部技术氛围浓厚。

技术前沿前沿/新兴技术
技术栈大模型、LLM、VLM、Agent、具身智能、NLP、CV
成长机会推动AGI数据建设、参与VLM、LLM、Agent、具身智能等多个前沿大模型基座的数据工作
业务类型profit_center

工作生活匹配

40较低

工作地点上海现场办公,JD未提及弹性工作或加班情况。互联网大厂普遍工作节奏快,WLB可能较差。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

85较高

参与AGI数据建设具有使命感,属于前沿科技领域,社会影响力高,但具体业务方向可能偏工程而非学术。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号推动AGI数据建设
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 资深研发工程师(互动方向)-国际化内容安全平台

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 平台产品营销经理-国际化广告商业平台

    字节跳动 · 深圳市
    AI 估算 · 30k-50k
  • 大语言模型通用Agent研究工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 推荐算法工程师(多端电商)-抖音电商

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • 国际战略专家-TikTok Shop

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 昆仑芯-芯片研发实习生(J83484)

    百度 · 北京市
    AI 估算 · 6k-10k
  • 广告算法工程师实习生(J97403)

    百度 · 上海市
    AI 估算 · 5k-8k
  • 生态研发组_实习PNC规控算法工程师(J71278)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 推荐策略实习生(J72891)

    百度 · 北京市
    AI 估算 · 5k-8k
  • 大模型/多模态算法工程师(J94551)

    百度 · 北京市
    AI 估算 · 30k-50k

字节跳动 的其他在招职位

  • 资深研发工程师(互动方向)-国际化内容安全平台

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 平台产品营销经理-国际化广告商业平台

    字节跳动 · 深圳市
    AI 估算 · 30k-50k
  • 大语言模型通用Agent研究工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 推荐算法工程师(多端电商)-抖音电商

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • 国际战略专家-TikTok Shop

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 昆仑芯-芯片研发实习生(J83484)

    百度 · 北京市
    AI 估算 · 6k-10k
  • 广告算法工程师实习生(J97403)

    百度 · 上海市
    AI 估算 · 5k-8k
  • 生态研发组_实习PNC规控算法工程师(J71278)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 推荐策略实习生(J72891)

    百度 · 北京市
    AI 估算 · 5k-8k
  • 大模型/多模态算法工程师(J94551)

    百度 · 北京市
    AI 估算 · 30k-50k