Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型评测研究员-智能安全
立即应聘

大模型评测研究员-智能安全

发布于 大约 7 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
研究与开发 (研发)
安全
AI安全
逆向工程
渗透测试
大模型
CTF
漏洞挖掘
评测

AI 估算 · 30k–60k

大模型安全是前沿方向,高级研究员在字节跳动现有竞争力,月薪3-6万属合理区间。

职位详情

关于这个职位

该职位负责大模型安全评测,包括研究模型安全效果、设计Benchmark、搭建评测流程,并与模型训练和安全团队协作,为优化大模型安全能力提供关键支撑

适合对AI安全有热情、具备扎实动手能力的研究者

最低要求

对评测有激情,相信评测的重要性

有大模型“和”安全领域相关的经验和意识,例如CTF/漏洞/逆向/模型训练/Agents设计
扎实的动手能力和代码功底
踏实,关注细节,跨团队协作能力强,具备处理模糊问题的能力

工作职责

深度研究大模型安全应用效果(如漏洞挖掘/渗透测试),持续跟进SOTA模型&评测指标

持续定义新的大模型安全任务能力,提出更好的Benchmark,拓展大模型安全应用的边界
搭建评测流程,保障准确、高效、可复现
与模型训练、Agents团队和安全团队协作深度分析评测结果给出优化点

优先资格

在大模型或AI安全领域,主导过有影响力的项目或论文者优先

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,数据、算力和跨团队支持强
  • 评测工作影响模型安全能力,具有高价值感和成就感
  • 团队氛围技术导向,有机会发表顶级论文或开源项目
  • 安全领域变化快,需要持续学习最新技术,保持高强度追踪

缺点 / 挑战

  • 身处大模型安全前沿,技术挑战大,个人成长空间广阔
  • 评测可能涉及大量重复性工作,需耐心和细致
  • 跨团队协作多,需处理模糊需求,沟通成本较高
  • 适合对AI安全有浓厚兴趣、具备扎实技术功底、喜欢挑战前沿问题并且注重细节的研究型人才

角色解读

  • 在AI安全评测领域深耕,成为安全评测专家,主导行业标准制定
  • 转向大模型安全对抗或模型安全防御方向,成为AI安全领域的核心研究者
  • 逐步承担技术管理职责,带领评测团队,或转入安全产品化方向
  • 深入研究大模型在安全领域的应用效果,进行漏洞挖掘和渗透测试,跟踪最新模型和评测指标
  • 设计并定义新的安全评测任务,提出更完善的Benchmark,拓展大模型安全边界
  • 搭建和优化评测流程,确保评测的准确性、高效性和可复现性
  • 与模型训练、Agents和安全团队协作,分析评测结果,为模型优化提供建议
  • 扎实的编程能力,熟练使用Python等语言进行代码开发和自动化评测
  • 大模型和AI安全领域的知识积累,包括CTF、漏洞分析、逆向工程、模型训练或Agents设计
  • 对评测方法有深刻理解,能设计合理的评测指标和流程
  • 优秀的团队协作和沟通能力,能高效跨团队推进项目

申请策略

  • 提前了解字节跳动在智能安全领域的产品布局,思考如何贡献
  • 在面试中主动展示对评测方法的独特见解,体现激情
  • 突出大模型或安全领域的项目经历,尤其是漏洞挖掘、CTF竞赛、模型评测等
  • 展示发表的论文或开源贡献,强调在安全评测或模型安全方面的创新
  • 详细描述搭建评测流程或设计Benchmark的经验,突出量化成果
  • 用具体案例体现跨团队协作和解决模糊问题的能力
  • 深入了解主流大模型的安全漏洞(如Prompt注入、越狱攻击等)
  • 掌握常用的安全评测框架和工具,如LangChain、Hugging Face等

面试指南

  • 对开放式问题,先明确目标,再给出方法论,最后举例说明
  • 对项目问题,使用STAR法则(情境、任务、行动、结果)
  • 对技术问题,先拆解问题要点,再逐步给出解决方案,体现逻辑性
  • 你如何设计一个针对大模型越狱攻击的评测方案?
  • 请描述一个你主导过的安全评测项目,遇到的最大挑战是什么?
  • 如何确保评测结果的可复现性?
  • 如果你发现一个模型的安全漏洞,你如何推动团队优化?
  • 你对当前大模型安全领域的热点问题怎么看?

匹配度报告

78
综合匹配度

字节跳动大模型安全评测岗,前沿技术赛道,高成长性,薪资有竞争力,但办公灵活性一般。

适合人群
适合追求技术前沿和成长、对AI安全有热情、能接受一定工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活60
使命价值85

薪资福利匹配

75中等

字节跳动薪资有竞争力,但未明确具体数字,且作为安全研究员,高薪预期存在。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

大模型安全是前沿领域,职位涉及SOTA模型和评测创新,能极大促进技术成长。

技术前沿前沿/新兴技术
技术栈大模型、安全、漏洞挖掘、渗透测试、Benchmark、评测、AI安全、CTF、逆向工程、Agents
成长机会深度研究、持续跟进SOTA模型&评测指标
业务类型ambiguous

工作生活匹配

60中等

北京现场办公,字节跳动工作节奏较快,但未明确强调加班。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

85较高

大模型安全评测具有重要社会意义,能够提升AI安全性,行业前景广阔。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 商家素材策略运营(自助中心)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 15k-25k
  • 女装行业运营-抖音电商(苏皖)

    字节跳动 · 上海市
    AI 估算 · 12k-20k
  • 广告算法工程师-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 后端开发工程师(AI Agent)-国际化广告质量效能(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 品牌营销专家(活动方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k

相似职位推荐

  • AI创新技术负责人

    网易 · 北京市
    AI 估算 · 50k-80k
  • 广西页岩气公司-科技创新岗

    广西投资集团 · 柳州市
    AI 估算 · 12k-13k
  • 广西页岩气公司-压裂试气岗

    广西投资集团 · 柳州市
    AI 估算 · 12k-13k
  • 广西页岩气公司-气藏管理岗

    广西投资集团 · 柳州市
    AI 估算 · 12k-13k

字节跳动 的其他在招职位

  • 商家素材策略运营(自助中心)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 15k-25k
  • 女装行业运营-抖音电商(苏皖)

    字节跳动 · 上海市
    AI 估算 · 12k-20k
  • 广告算法工程师-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 后端开发工程师(AI Agent)-国际化广告质量效能(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 品牌营销专家(活动方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k

相似职位推荐

  • AI创新技术负责人

    网易 · 北京市
    AI 估算 · 50k-80k
  • 广西页岩气公司-科技创新岗

    广西投资集团 · 柳州市
    AI 估算 · 12k-13k
  • 广西页岩气公司-压裂试气岗

    广西投资集团 · 柳州市
    AI 估算 · 12k-13k
  • 广西页岩气公司-气藏管理岗

    广西投资集团 · 柳州市
    AI 估算 · 12k-13k