Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大语言模型评测研究员-Seed
立即应聘

大语言模型评测研究员-Seed

发布于 大约 3 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
预训练
可解释性
大语言模型
AGI
评测
豆包
Post-Training
火山引擎

AI 估算 · 35k–65k

字节跳动大模型核心岗位,技术前沿且人才稀缺,薪资处于行业领先水平。

职位详情

关于这个职位

该职位主要负责大语言模型的评测研究,包括探索模型预训练与后训练的内在一致性、提出基于可解释性的评测标准、设计新型Benchmark以定义AGI,并通过Red Teaming发现模型短板

你将加入字节跳动Seed团队,参与豆包等核心应用的模型能力评估,推动AI前沿发展

最低要求

聚焦问题本质,从第一性原理思考问题

对模型评测和定义AGI充满兴趣

工作职责

探索模型在预训练阶段与Post-training阶段的内在一致性,跨训练阶段预测模型性能上限

探索从可解释性角度提出更多更深入的基于模型内在机理的评测标准
提出更好的Benchmark,定义模型能力,定义AGI
从评测角度对模型进行Red Teaming,找到模型的短板并针对性提出模型改进
探索全新的模型和智能应用,如Agent Foundation Model,DeepResearch,需要的评测基准

优先资格

有大模型训练或模型评估研究经验,和相关论文优先

AI 洞察

优缺点分析

优点

  • 加入字节跳动Seed核心团队,参与前沿AGI研究,技术影响力大
  • 资源丰富,有机会使用海量数据和计算资源进行实验
  • 与顶尖AI研究员合作,职业成长空间广阔
  • 评测工作涉及大量实验和数据分析,可能较为繁琐
  • 大模型迭代快,需要不断更新知识体系
  • 适合对AI评测有浓厚兴趣、具备扎实机器学习基础、喜欢从第一性原理探索问题的研究型人才

缺点 / 挑战

  • 竞争激烈,需要持续跟进最新技术动态,研究压力较大

角色解读

  • 成为大模型评测领域专家,主导公司级评测体系构建
  • 转向模型训练或算法研究岗,参与核心模型开发
  • 晋升技术专家或团队管理岗位,带领评测团队
  • 设计并实施大模型评测方案,评估模型在预训练和post-training阶段的性能
  • 研究模型内在机理,提出基于可解释性的评测标准,用于定义模型能力
  • 参与Red Teaming,主动发现模型短板并推动针对性改进
  • 跟踪前沿AI应用如Agent Foundation Model,探索其评测基准
  • 深入理解大语言模型原理及训练流程,熟悉常见评测方法(如MMLU, GSM8K)
  • 具备较强的实验设计和数据分析能力,能从第一性原理思考问题
  • 对模型可解释性、AI安全有研究经验者优先
  • 掌握至少一种深度学习框架(PyTorch/TensorFlow),有扎实的编程能力

申请策略

  • 提前研究字节跳动Seed团队发表的论文和技术博客
  • 准备一份针对评测研究的思考总结,展现你的独到见解
  • 突出大模型训练或评估项目经验,展示量化成果
  • 强调发表的相关论文或竞赛成绩(如KDD Cup, Kaggle)
  • 体现对模型内在机理的理解和批判性思维
  • 学习最新大模型评测方法和基准,如BIG-bench, HumanEval
  • 掌握Red Teaming工具和技术,了解AI安全前沿

面试指南

  • 使用STAR法则(情境、任务、行动、结果)描述项目经验
  • 强调实验设计方法论,如控制变量、消融实验、统计显著性
  • 从第一性原理出发,先定义评估目标再选择或设计评测方案
  • 如何设计一个评测任务来评估大模型的推理能力?
  • 你如何判断一个评测基准是否有效?举一个例子
  • 谈谈你对模型可解释性的理解,如何将其用于评测?
  • 描述一次你发现模型短板并推动改进的经历
  • 你认为AGI的评测应该包括哪些维度?

匹配度报告

72
综合匹配度

字节大模型核心研发岗,前沿技术栈,高成长高压力,适合追求技术巅峰的研究型人才。

适合人群
最适合追求技术成长和前沿探索、对AGI有热情、能适应高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值85

薪资福利匹配

75中等

字节跳动提供有竞争力的薪资和福利,但JD中未明确提及具体福利,薪资信号未披露。

薪资信号未披露(AI估算:35K-65K/月)

成长发展匹配

90较高

该职位位于大模型前沿,涉及AGI定义和评测,技术挑战大,成长空间极高。

技术前沿前沿/新兴技术
技术栈大语言模型、预训练、Post-training、可解释性、Red Teaming、AGI、Agent Foundation Model
业务类型profit_center

工作生活匹配

40较低

北京现场办公,JD中未提及弹性工作或WLB,互联网大厂通常工作强度较大。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

85较高

参与定义AGI和推动AI发展,具有较高的使命感和行业影响力。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号追求智能上限,为科技和社会发展作出贡献
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 人审交付运营(BPO/众包方向)-大模型安全&模型运维

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • AI搜索/Agent算法工程师-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-60k
  • 后端开发工程师(数据方向)-国际化(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 后端开发工程师-国际化达人营销平台

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 保险增长产品经理-财经

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • Senior Process Engineer-Ultrasound Transducer

    飞利浦 · 上海市
    AI 估算 · 25k-40k
  • Advanced System Engineer

    飞利浦 · 沈阳市
    AI 估算 · 15k-22k
  • Senior Electronics Development Engineer

    飞利浦 · 深圳市
    AI 估算 · 35k-50k
  • User Experience Researcher

    飞利浦 · 深圳市
    AI 估算 · 25k-40k
  • Physics & Algorithm Intern

    飞利浦 · 沈阳市
    AI 估算 · 3k-5k

字节跳动 的其他在招职位

  • 人审交付运营(BPO/众包方向)-大模型安全&模型运维

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • AI搜索/Agent算法工程师-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-60k
  • 后端开发工程师(数据方向)-国际化(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 后端开发工程师-国际化达人营销平台

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 保险增长产品经理-财经

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • Senior Process Engineer-Ultrasound Transducer

    飞利浦 · 上海市
    AI 估算 · 25k-40k
  • Advanced System Engineer

    飞利浦 · 沈阳市
    AI 估算 · 15k-22k
  • Senior Electronics Development Engineer

    飞利浦 · 深圳市
    AI 估算 · 35k-50k
  • User Experience Researcher

    飞利浦 · 深圳市
    AI 估算 · 25k-40k
  • Physics & Algorithm Intern

    飞利浦 · 沈阳市
    AI 估算 · 3k-5k