Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
Agent与大模型安全算法工程师-飞书
立即应聘

Agent与大模型安全算法工程师-飞书

发布于 大约 14 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
RAG
SFT
PPO
RLHF
AutoGPT
安全攻防
DPO

AI 估算 · 25k–45k

上海字节跳动大模型安全岗位,技术门槛高,市场稀缺,薪资竞争力强。

职位详情

关于这个职位

作为飞书Agent与大模型安全算法工程师,你将负责构建系统性安全评测标准与风险检测算法,研究对齐技术提升模型可控性,并主导Red Team攻防测试

这是一个站在AI安全前沿、兼具研究深度与工程实践的高技术岗位

最低要求

两年以上算法研发经历,计算机相关专业本科及以上学历

编程能力强,至少精通一种编程语言(Python/Go等),熟悉LangChain/AutoGPT/Hadoop/Spark/Flink等框架
熟悉Transformer架构及主流训练范式(SFT、RLHF、DPO、PPO等),理解Reward Model、对齐机制与安全约束建模
对Prompt Injection、防越权机制、模型幻觉治理等方向有深入认知
理解Agent工具调用链、函数调用、Memory机制、RAG架构
具备运行时行为检测、异常检测、时序建模经验者优先
了解当前主流的AI安全问题与攻防方法,包括但不限于Prompt Injection(直接注入与间接注入)、Jailbreak、数据投毒、模型逆向、对抗样本、模型滥用及越权调用第三方服务等攻击手段与防御思路
安全攻防或威胁建模经验:具备一定的安全研究、渗透测试、红队演练或威胁建模经验,能够从攻击者视角系统性地分析复杂系统的安全风险面

工作职责

构建覆盖Prompt Injection、越权调用、数据泄露、上下文污染、模型幻觉、滥用自动化能力等风险的系统性评估数据集与基准,形成面向飞书内大模型的安全评测标准

针对具备“数字分身”能力的Agent(如OpenClaw类自动化工具),构建Agent运行时行为特征体系(Tool调用图谱、API调用频率分布、会话节奏、上下文压缩模式等),设计Agent风险检测算法,通过实时拦截、分级管控与审计溯源保障Agent安全
研究模型在攻击扰动下的一致性、稳定性与安全边界,探索SFT/RLHF/DPO等对齐技术在安全决策场景中的有效性与局限,提升模型在复杂交互场景中的可控性与风险收敛能力
建立大模型Red Team机制,系统性设计攻击向量(Prompt注入、工具劫持、记忆污染、RAG检索污染、多轮诱导攻击等),持续发现模型和Agent系统的结构性弱点,并推动工程侧闭环优化

优先资格

加分项

在AI安全、对抗机器学习、系统安全等领域发表过高质量学术论文(如顶会S&P、USENIX Security、CCS、NeurIPS、ICML、ACL等),或在相关开源项目中有持续贡献
有大模型应用或智能体系统的安全研究、攻防测试或安全治理的实战经验,曾主导或深度参与过相关安全项目

AI 洞察

优缺点分析

优点

  • 字节跳动大厂平台,资源丰富,项目影响力覆盖亿级用户
  • 团队氛围好,鼓励创新,有Red Team实战机会
  • 知识面要求极广,需同时精通AI算法、安全攻防和工程部署
  • 初创领域,没有成熟方法论可参考,需要较强的探索和落地能力
  • 适合对AI安全有浓厚热情、喜欢攻防博弈、具备较强学习能力和工程落地能力的算法工程师

缺点 / 挑战

  • 站在AI安全最前沿,技术挑战大,快速积累稀缺经验
  • 攻击对抗压力大,需要持续跟进最新安全漏洞和攻击手法

角色解读

  • 成为AI安全领域的资深专家,主导大模型安全标准与策略制定
  • 向上晋升为安全技术负责人或安全架构师,负责整体安全方案设计
  • 向研究方向发展,产出高水平论文或开源项目,影响行业安全实践
  • 构建覆盖各类风险的系统性安全评测数据集与基准,形成为飞书定制的安全评测标准
  • 设计Agent运行时行为特征体系与风险检测算法,实时拦截分级管控
  • 研究模型对齐技术在安全决策中的有效性,提升模型可控性与风险收敛能力
  • 建立Red Team机制,系统性设计攻击向量并推动工程闭环优化
  • 精通Python/Go,熟悉LangChain、AutoGPT等Agent框架及大数据处理技术
  • 深入理解Transformer架构及SFT、RLHF、DPO等对齐训练范式
  • 掌握Prompt Injection、Jailbreak、数据投毒等主流AI攻防方法与防御思路
  • 具备安全研究、渗透测试或威胁建模经验,能从攻击者视角分析系统风险

申请策略

  • 面试前准备一个完整的Agent安全项目案例,从问题定义到方案落地
  • 关注飞书产品特点和大模型应用场景,思考其独特的安全风险
  • 突出大模型或Agent相关的安全项目经历,包括攻击模拟、防御方案设计等
  • 强调编程能力和框架使用经验,列出熟悉的技术栈及实际应用场景
  • 展示对对齐技术(SFT/RLHF/DPO)的理解及在安全方向的应用思考
  • 如果有安全攻防或红队经验,务必详细描述角色与成果
  • 补充Red Team实战经验,可参与开源安全项目或自建测试环境练习
  • 深入阅读AI安全顶会论文,了解最新攻击向量和防御技术

面试指南

  • 对于攻击防御类问题,建议采用“攻击原理-危害-防御方案-局限性”结构回答
  • 对于系统设计类问题,使用STAR原则:情境-任务-行动-结果,突出个人贡献
  • 对于开放性问题,先明确问题边界,再提出分阶段或分模块的思路
  • 请详细描述Prompt Injection攻击的原理、分类以及如何防御?
  • 如何检测一个Agent是否被越权调用或存在数据泄露风险?
  • 在RLHF训练中,如何设计Reward Model来约束模型生成的安全性?
  • 如果让你设计一个针对多轮对话的Red Team测试方案,你会如何做?
  • 请举例说明你在过去项目中遇到的安全挑战及解决方案

匹配度报告

76
综合匹配度

前沿大模型安全岗位,技术成长快,薪资优厚,但工作强度可能较高。

适合人群
最适合追求技术成长和前沿探索的求职者,愿意接受高强度工作以换取快速的能力提升和职业发展。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活50
使命价值75

薪资福利匹配

85较高

字节跳动薪资福利在业内具有显著竞争力,且该岗位属于高价值技术方向,预期薪资偏高,能满足补偿性动机。

薪资信号偏高 (25K-45K/月)

成长发展匹配

95较高

岗位涉及大模型安全这一前沿技术领域,技能成长空间极大,且有Red Team实战机会,发展性动机获得高度满足。

技术前沿前沿/新兴技术
技术栈LLM、Agent、Prompt Injection、RLHF、RAG、SFT、DPO
业务类型ambiguous

工作生活匹配

50较低

工作模式为仅现场办公,未提及灵活办公或WLB相关福利,典型互联网大厂节奏,生活化动机满足程度有限。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

75中等

AI安全具有重要的社会价值,保护用户数据安全与模型可信,但岗位本身更偏技术实现,使命导向的体现一般。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI Agent算法专家(智能创作方向)

    快手 · 北京市
    AI 估算 · 35k-55k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • 【26年度台湾地区青年实习】机械制造设计(东航资产)

    中国东方航空 · 上海市
    AI 估算 · 4k-6k
  • 大模型应用评测算法工程师

    美团 · 北京市
    AI 估算 · 25k-45k

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI Agent算法专家(智能创作方向)

    快手 · 北京市
    AI 估算 · 35k-55k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • 【26年度台湾地区青年实习】机械制造设计(东航资产)

    中国东方航空 · 上海市
    AI 估算 · 4k-6k
  • 大模型应用评测算法工程师

    美团 · 北京市
    AI 估算 · 25k-45k