Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
业务/大模型评测专家-抖音
立即应聘

业务/大模型评测专家-抖音

发布于 1 天前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
RAG
LLM
多模态
模型微调
Prompt Engineering
画质评测
美颜评测

AI 估算 · 25k–45k

字节跳动AI岗位,北京核心业务,技能稀缺,薪资竞争力强。

职位详情

关于这个职位

作为字节跳动抖音业务的AI评测专家,你将负责大模型及AI产品的评测体系建设,设计评测方案并执行数据分析,为算法优化提供关键结论

需要兼具编程能力(Python/C++/Java)、大模型应用经验(如LLM、多模态、模型微调)和一定的视觉审美素养
这是一个在核心业务中深度参与AI技术落地的岗位

最低要求

本科学历及以上,具备优秀的沟通、团队合作和快速学习能力

熟练掌握Python/C/C++/Java中至少一种语言及相关技术栈,具备良好的编程能力和规范
具备AI大模型相关技术实践经验,有以下一个或多个方向的实际落地经验优先:LLM应用(Prompt Engineering、RAG、Agent等)、多模态模型(图像/视频理解、生成模型)、模型微调(SFT/LoRA/DPO等)
有美颜、画质评测经验,或设计、摄影背景,有较高视觉鉴赏水平者优先

工作职责

独立负责业务重点AI产品评测及评测体系建设,包括效果性能分析、产品分析、机评能力建设等

根据需求设计评测方案,覆盖业务场景数据,进行数据分析并执行评测,给出算法效果结论及优化建议
挖掘新的测试和评测方法,对评测中遇到的问题进行专项研究和改进

AI 洞察

优缺点分析

优点

  • 字节跳动大平台,核心业务,接触前沿AI技术
  • 参与大模型评测,深度理解AI模型能力边界
  • 团队技术氛围浓厚,成长空间大
  • 评测工作需高度细致耐心,面对海量数据和分析任务
  • 大模型技术更新快,需要持续学习新方向
  • 适合对AI技术充满热情、编程能力强、有一定审美素养的求职者,尤其适合希望深入理解大模型应用效果的人

缺点 / 挑战

  • 字节跳动工作强度可能较高,需适应快节奏

角色解读

  • 在AI评测领域深耕,成为评测专家,主导评测方法论建设
  • 向AI产品经理或算法工程师转型,深入参与产品研发
  • 在字节跳动内部晋升为技术Leader,带领团队
  • 负责抖音AI产品的评测体系搭建,包括效果分析、产品分析和自动化评测能力建设
  • 设计评测方案,覆盖业务场景,通过数据分析给出算法优化建议
  • 探索新的评测方法,解决评测过程中的技术难题
  • 精通Python/C++/Java等至少一种编程语言,具备良好的工程能力
  • 有AI大模型应用经验,包括Prompt Engineering、RAG、Agent等方向
  • 熟悉多模态模型、模型微调技术(SFT/LoRA/DPO)
  • 具备视觉鉴赏能力,有美颜、画质评测经验者优先

申请策略

  • 可附上个人技术博客或GitHub项目,展示AI相关实践
  • 了解抖音AI产品方向(如特效、推荐算法),面试中体现关联思考
  • 突出AI大模型相关项目经验,特别是评测或效果分析案例
  • 强调编程能力,列出熟悉的技术栈和代码质量经验
  • 如有视觉背景(美颜、摄影、设计),需重点展示
  • 补充多模态模型的知识,了解主流模型评测指标
  • 学习评测方法论,如AB测试、指标设计等

面试指南

  • 分步骤回答:需求分析→指标选择→数据集构建→执行→分析,结合具体案例
  • 突出数据驱动思维:强调如何用数据验证假设
  • 如何设计一个评测方案来评估大模型的对话质量?
  • 你用过哪些评测指标?如何选择适合场景的指标?
  • 面对评测中的噪声数据,你会如何处理?
  • 如何衡量美颜效果?有哪些客观和主观指标?
  • 你如何快速学习一个新模型并建立评测标准?
  • 复习大模型基础知识(Transformer、RLHF等)

匹配度报告

69
综合匹配度

字节抖音AI评测专家,前沿技术栈,高薪资高成长,但工作强度大。

适合人群
该职位最适合追求技术成长和薪资回报的求职者,能接受一定工作强度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值60

薪资福利匹配

85较高

字节跳动薪资福利在行业内有竞争力,北京核心岗位,但JD未明确透露薪资和具体福利,仅从公司层面判断较高。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

90较高

岗位涉及前沿AI技术(大模型、多模态),成长空间大,但JD未明确提及晋升或培训机制。

技术前沿前沿/新兴技术
技术栈Python、LLM、Prompt Engineering、RAG、Agent、多模态、SFT、LoRA、DPO
业务类型profit_center

工作生活匹配

40较低

北京办公,未提及远程或弹性工作,字节跳动工作强度普遍较高,WLB一般。

工作模式未明确
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

60中等

AI行业前景好,但岗位偏技术评测,社会影响力中性,创新活跃。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Intern, Data Mining_Onboarding

    巴斯夫 · 上海市
    AI 估算 · 4k-6k
  • 数据分析岗

    京东 · 北京市
    AI 估算 · 25k-40k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Intern, Data Mining_Onboarding

    巴斯夫 · 上海市
    AI 估算 · 4k-6k
  • 数据分析岗

    京东 · 北京市
    AI 估算 · 25k-40k