Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
世界模型评测专家(自动化)-AI数据与安全
立即应聘

世界模型评测专家(自动化)-AI数据与安全

发布于 大约 14 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
机器学习
强化学习
数据处理
计算机视觉
视频生成
游戏引擎
多模态模型
世界模型
自动化评测

AI 估算 · 25k–50k

结合北京中级AI研发岗市场水平,字节跳动薪资有竞争力,取中位数。

职位详情

关于这个职位

该职位负责设计并开发世界模型的自动化评测方案,包括评测工具和流程,输出系统化评测报告,为算法优化和模型迭代提供决策支持

你将深入调研前沿评测方法,推动内部平台集成,并构建贴合真实场景的评测集
适合对AI评测、视频生成、世界模型有热情的技术人才

最低要求

本科及以上学历,计算机相关专业,如计算机科学与技术、软件工程、人工智能、数据科学等

熟练掌握Python开发,具备良好的工程能力与数据处理能力
对计算机视觉、机器学习、多模态模型或强化学习有一定了解
对视频生成、世界模型、仿真环境、游戏引擎相关技术有一定理解,对时序建模、控制信号建模(Action/Trajectory/Camera等)有基础认知
熟悉生成模型评测方法,能够从人工评测标准抽象为自动化评测指标,有评测体系设计经验者优先
对GenAI方向有热情,具备强学习能力与探索精神,能够在快速发展的技术环境中持续迭代认知与方案

工作职责

探索智能、高效的世界模型自动化评测方案,主导评测体系与评测工具的设计与开发

调研业内领先的世界模型评测方法,如控制一致性、时序一致性、物理合理性等,将优质评测集与评测流程集成至内部平台,并推动自研评测集的构建与迭代,保障贴合真实交互与游戏场景
输出系统化评测报告,为算法优化、模型选型与迭代提供数据支撑与决策建议

优先资格

理解玩家视角下的交互体验、合理性与沉浸感的3A游戏或主机游戏(如开放世界、动作类、模拟类等)重度爱好者优先

AI 洞察

优缺点分析

优点

  • 接触前沿技术(世界模型、视频生成),技术成长快
  • 字节跳动平台大,资源丰富,项目影响力广
  • 评测岗位稀缺,可积累独特竞争力
  • 世界模型技术迭代快,需要持续学习
  • 评测标准难定义,需大量抽象和工程化工作
  • 可能面临高强度工作节奏
  • 对AI评测有热情,喜欢钻研新技术,具备良好工程能力和游戏理解的技术型人才

缺点 / 挑战

暂无明显挑战项

角色解读

  • 深入AI评测领域,成为世界模型评测专家
  • 横向拓展至算法优化、模型训练等方向,向全栈AI工程师发展
  • 可晋升为技术Leader或架构师,主导评测平台建设
  • 设计并开发世界模型自动化评测方案,包括评测体系、工具和流程
  • 调研前沿评测方法(如控制一致性、时序一致性),集成至内部平台并构建自研评测集
  • 输出系统化评测报告,为算法优化和模型选型提供数据支撑
  • 精通Python,具备良好的工程能力和数据处理能力
  • 了解计算机视觉、机器学习、多模态模型或强化学习
  • 理解视频生成、世界模型、仿真环境、游戏引擎等概念
  • 熟悉生成模型评测方法,能抽象为自动化指标

申请策略

  • 关注字节跳动在AI数据与安全领域的布局,展示对GenAI的热情
  • 在面试中准备一个评测体系设计的案例,体现系统化思维
  • 突出Python开发经验及数据处理项目
  • 展示CV、ML、多模态或强化学习相关项目
  • 如有评测体系设计或自动化评测工具开发经历,重点描述
  • 强调对视频生成、世界模型或游戏引擎的理解
  • 补充世界模型和视频生成相关论文阅读
  • 动手实践主流评测框架(如CLIP Score、FVD等)

面试指南

  • 对于评测设计问题:先明确评测目标,再分解为可量化指标,最后提出工程实现方案
  • 对于技术理解问题:从原理到应用,结合实际项目经历,展示深度
  • 你如何设计一个自动化评测方案来评估世界模型的时序一致性?
  • 请举例说明如何将人工评测标准转化为自动化指标
  • 你熟悉的生成模型评测方法有哪些?各有什么优缺点?
  • 谈谈你对世界模型的理解,以及它与传统模拟的区别
  • 你有使用过哪些游戏引擎或仿真工具?如何与AI模型结合?
  • 复习世界模型、视频生成相关论文(如Sora、Genie等)

匹配度报告

70
综合匹配度

前沿AI评测岗,技术成长快,但WLB一般,薪资面议。

适合人群
适合追求技术前沿和快速成长、对工作生活平衡要求不高的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利65
成长发展90
工作生活50
使命价值75

薪资福利匹配

65中等

JD未明确薪资和福利,但字节跳动作为大厂通常提供有竞争力的薪酬,具体需面议。

薪资信号未披露(AI估算:25K-50K/月)

成长发展匹配

90较高

技术栈前沿(世界模型、视频生成),行业高速增长,但JD未明确晋升路径。

技术前沿前沿/新兴技术
技术栈Python、计算机视觉、机器学习、多模态模型、强化学习、视频生成、世界模型、时序建模、控制信号建模、游戏引擎
业务类型ambiguous

工作生活匹配

50较低

JD未提及远程或弹性工作,地点在北京,未明确WLB,大厂通常有一定加班文化。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

75中等

AI世界模型评测属于高速增长赛道,技术具有创新性,但社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 物流供应商管理专家-TikTok Shop

    字节跳动 · 珠海市
    AI 估算 · 25k-40k
  • 产品经理(广告信号方向)-国际商业化产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 消息队列产品经理-Data

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家产品运营高级经理-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • CRM产品经理(AI方向)-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-55k

相似职位推荐

  • 项目计划管理

    中国移动 · 长沙市
    AI 估算 · 8k-18k
  • 智能建模师

    中国移动 · 长沙市
    AI 估算 · 8k-15k
  • 大模型训练

    中国移动 · 长沙市
    AI 估算 · 3k-5k
  • 【REDstar】大模型 Efficient Inference Infra 工程师

    小红书 · 北京市
    AI 估算 · 30k-60k

字节跳动 的其他在招职位

  • 物流供应商管理专家-TikTok Shop

    字节跳动 · 珠海市
    AI 估算 · 25k-40k
  • 产品经理(广告信号方向)-国际商业化产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 消息队列产品经理-Data

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家产品运营高级经理-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • CRM产品经理(AI方向)-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-55k

相似职位推荐

  • 项目计划管理

    中国移动 · 长沙市
    AI 估算 · 8k-18k
  • 智能建模师

    中国移动 · 长沙市
    AI 估算 · 8k-15k
  • 大模型训练

    中国移动 · 长沙市
    AI 估算 · 3k-5k
  • 【REDstar】大模型 Efficient Inference Infra 工程师

    小红书 · 北京市
    AI 估算 · 30k-60k