字节跳动的Agent与大模型安全算法工程师-飞书薪资是多少？

该职位薪资范围为 25k–45k（人民币/月）。

Agent与大模型安全算法工程师-飞书的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

字节跳动的Agent与大模型安全算法工程师-飞书有什么任职要求？

该职位要求本科学历及中级经验工作经验。

字节跳动

Agent与大模型安全算法工程师-飞书

立即应聘

Agent与大模型安全算法工程师-飞书

发布于大约 2 个月前

普通员工/个人贡献者

上海市

中级经验

全职员工

仅现场办公

本科

研究与开发 (研发)

安全攻防

AutoGPT

DPO

PPO

RAG

RLHF

SFT

AI 估算 · 25k–45k

上海字节跳动大模型安全岗位，技术门槛高，市场稀缺，薪资竞争力强。

职位详情

关于这个职位

作为飞书Agent与大模型安全算法工程师，你将负责构建系统性安全评测标准与风险检测算法，研究对齐技术提升模型可控性，并主导Red Team攻防测试

这是一个站在AI安全前沿、兼具研究深度与工程实践的高技术岗位

最低要求

两年以上算法研发经历，计算机相关专业本科及以上学历

编程能力强，至少精通一种编程语言（Python/Go等），熟悉LangChain/AutoGPT/Hadoop/Spark/Flink等框架

熟悉Transformer架构及主流训练范式（SFT、RLHF、DPO、PPO等），理解Reward Model、对齐机制与安全约束建模

对Prompt Injection、防越权机制、模型幻觉治理等方向有深入认知

理解Agent工具调用链、函数调用、Memory机制、RAG架构

具备运行时行为检测、异常检测、时序建模经验者优先

了解当前主流的AI安全问题与攻防方法，包括但不限于Prompt Injection（直接注入与间接注入）、Jailbreak、数据投毒、模型逆向、对抗样本、模型滥用及越权调用第三方服务等攻击手段与防御思路

安全攻防或威胁建模经验：具备一定的安全研究、渗透测试、红队演练或威胁建模经验，能够从攻击者视角系统性地分析复杂系统的安全风险面

工作职责

构建覆盖Prompt Injection、越权调用、数据泄露、上下文污染、模型幻觉、滥用自动化能力等风险的系统性评估数据集与基准，形成面向飞书内大模型的安全评测标准

针对具备“数字分身”能力的Agent（如OpenClaw类自动化工具），构建Agent运行时行为特征体系（Tool调用图谱、API调用频率分布、会话节奏、上下文压缩模式等），设计Agent风险检测算法，通过实时拦截、分级管控与审计溯源保障Agent安全

研究模型在攻击扰动下的一致性、稳定性与安全边界，探索SFT/RLHF/DPO等对齐技术在安全决策场景中的有效性与局限，提升模型在复杂交互场景中的可控性与风险收敛能力

建立大模型Red Team机制，系统性设计攻击向量（Prompt注入、工具劫持、记忆污染、RAG检索污染、多轮诱导攻击等），持续发现模型和Agent系统的结构性弱点，并推动工程侧闭环优化

优先资格

加分项

在AI安全、对抗机器学习、系统安全等领域发表过高质量学术论文（如顶会S&P、USENIX Security、CCS、NeurIPS、ICML、ACL等），或在相关开源项目中有持续贡献

有大模型应用或智能体系统的安全研究、攻防测试或安全治理的实战经验，曾主导或深度参与过相关安全项目

AI 洞察

优缺点分析

优点

字节跳动大厂平台，资源丰富，项目影响力覆盖亿级用户
团队氛围好，鼓励创新，有Red Team实战机会
知识面要求极广，需同时精通AI算法、安全攻防和工程部署
初创领域，没有成熟方法论可参考，需要较强的探索和落地能力
适合对AI安全有浓厚热情、喜欢攻防博弈、具备较强学习能力和工程落地能力的算法工程师

缺点 / 挑战

站在AI安全最前沿，技术挑战大，快速积累稀缺经验
攻击对抗压力大，需要持续跟进最新安全漏洞和攻击手法

角色解读

成为AI安全领域的资深专家，主导大模型安全标准与策略制定
向上晋升为安全技术负责人或安全架构师，负责整体安全方案设计
向研究方向发展，产出高水平论文或开源项目，影响行业安全实践
构建覆盖各类风险的系统性安全评测数据集与基准，形成为飞书定制的安全评测标准
设计Agent运行时行为特征体系与风险检测算法，实时拦截分级管控
研究模型对齐技术在安全决策中的有效性，提升模型可控性与风险收敛能力
建立Red Team机制，系统性设计攻击向量并推动工程闭环优化
精通Python/Go，熟悉LangChain、AutoGPT等Agent框架及大数据处理技术
深入理解Transformer架构及SFT、RLHF、DPO等对齐训练范式
掌握Prompt Injection、Jailbreak、数据投毒等主流AI攻防方法与防御思路
具备安全研究、渗透测试或威胁建模经验，能从攻击者视角分析系统风险

申请策略

面试前准备一个完整的Agent安全项目案例，从问题定义到方案落地
关注飞书产品特点和大模型应用场景，思考其独特的安全风险
突出大模型或Agent相关的安全项目经历，包括攻击模拟、防御方案设计等
强调编程能力和框架使用经验，列出熟悉的技术栈及实际应用场景
展示对对齐技术（SFT/RLHF/DPO）的理解及在安全方向的应用思考
如果有安全攻防或红队经验，务必详细描述角色与成果
补充Red Team实战经验，可参与开源安全项目或自建测试环境练习
深入阅读AI安全顶会论文，了解最新攻击向量和防御技术

面试指南

对于攻击防御类问题，建议采用“攻击原理-危害-防御方案-局限性”结构回答
对于系统设计类问题，使用STAR原则：情境-任务-行动-结果，突出个人贡献
对于开放性问题，先明确问题边界，再提出分阶段或分模块的思路
请详细描述Prompt Injection攻击的原理、分类以及如何防御？
如何检测一个Agent是否被越权调用或存在数据泄露风险？
在RLHF训练中，如何设计Reward Model来约束模型生成的安全性？
如果让你设计一个针对多轮对话的Red Team测试方案，你会如何做？
请举例说明你在过去项目中遇到的安全挑战及解决方案

职位点评

综合评分

前沿大模型安全岗位，技术成长快，薪资优厚，但工作强度可能较高。

更适合这类人

最适合追求技术成长和前沿探索的求职者，愿意接受高强度工作以换取快速的能力提升和职业发展。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展95

工作生活50

使命价值75

薪资福利

85较高

字节跳动薪资福利在业内具有显著竞争力，且该岗位属于高价值技术方向，预期薪资偏高，能满足补偿性动机。

薪资信号偏高 (25K-45K/月)

成长发展

95较高

岗位涉及大模型安全这一前沿技术领域，技能成长空间极大，且有Red Team实战机会，发展性动机获得高度满足。

技术前沿前沿/新兴技术

技术栈LLM、Agent、Prompt Injection、RLHF、RAG、SFT、DPO

业务类型ambiguous

工作生活

50较低

工作模式为仅现场办公，未提及灵活办公或WLB相关福利，典型互联网大厂节奏，生活化动机满足程度有限。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

75中等

AI安全具有重要的社会价值，保护用户数据安全与模型可信，但岗位本身更偏技术实现，使命导向的体现一般。

行业发展高速增长赛道

社会影响正向社会影响力较高

创新程度积极采用新技术

Watch Jobs

字节跳动

Agent与大模型安全算法工程师-飞书

立即应聘

Agent与大模型安全算法工程师-飞书

发布于大约 2 个月前

普通员工/个人贡献者

上海市

中级经验

全职员工

仅现场办公

本科

研究与开发 (研发)

安全攻防

AutoGPT

DPO

PPO

RAG

RLHF

SFT

AI 估算 · 25k–45k

上海字节跳动大模型安全岗位，技术门槛高，市场稀缺，薪资竞争力强。

职位详情

关于这个职位

作为飞书Agent与大模型安全算法工程师，你将负责构建系统性安全评测标准与风险检测算法，研究对齐技术提升模型可控性，并主导Red Team攻防测试

这是一个站在AI安全前沿、兼具研究深度与工程实践的高技术岗位

最低要求

两年以上算法研发经历，计算机相关专业本科及以上学历

编程能力强，至少精通一种编程语言（Python/Go等），熟悉LangChain/AutoGPT/Hadoop/Spark/Flink等框架

熟悉Transformer架构及主流训练范式（SFT、RLHF、DPO、PPO等），理解Reward Model、对齐机制与安全约束建模

对Prompt Injection、防越权机制、模型幻觉治理等方向有深入认知

理解Agent工具调用链、函数调用、Memory机制、RAG架构

具备运行时行为检测、异常检测、时序建模经验者优先

安全攻防或威胁建模经验：具备一定的安全研究、渗透测试、红队演练或威胁建模经验，能够从攻击者视角系统性地分析复杂系统的安全风险面

工作职责

优先资格

加分项

在AI安全、对抗机器学习、系统安全等领域发表过高质量学术论文（如顶会S&P、USENIX Security、CCS、NeurIPS、ICML、ACL等），或在相关开源项目中有持续贡献

有大模型应用或智能体系统的安全研究、攻防测试或安全治理的实战经验，曾主导或深度参与过相关安全项目

AI 洞察

优缺点分析

优点

字节跳动大厂平台，资源丰富，项目影响力覆盖亿级用户
团队氛围好，鼓励创新，有Red Team实战机会
知识面要求极广，需同时精通AI算法、安全攻防和工程部署
初创领域，没有成熟方法论可参考，需要较强的探索和落地能力
适合对AI安全有浓厚热情、喜欢攻防博弈、具备较强学习能力和工程落地能力的算法工程师

缺点 / 挑战

站在AI安全最前沿，技术挑战大，快速积累稀缺经验
攻击对抗压力大，需要持续跟进最新安全漏洞和攻击手法

角色解读

成为AI安全领域的资深专家，主导大模型安全标准与策略制定
向上晋升为安全技术负责人或安全架构师，负责整体安全方案设计
向研究方向发展，产出高水平论文或开源项目，影响行业安全实践
构建覆盖各类风险的系统性安全评测数据集与基准，形成为飞书定制的安全评测标准
设计Agent运行时行为特征体系与风险检测算法，实时拦截分级管控
研究模型对齐技术在安全决策中的有效性，提升模型可控性与风险收敛能力
建立Red Team机制，系统性设计攻击向量并推动工程闭环优化
精通Python/Go，熟悉LangChain、AutoGPT等Agent框架及大数据处理技术
深入理解Transformer架构及SFT、RLHF、DPO等对齐训练范式
掌握Prompt Injection、Jailbreak、数据投毒等主流AI攻防方法与防御思路
具备安全研究、渗透测试或威胁建模经验，能从攻击者视角分析系统风险

申请策略

面试前准备一个完整的Agent安全项目案例，从问题定义到方案落地
关注飞书产品特点和大模型应用场景，思考其独特的安全风险
突出大模型或Agent相关的安全项目经历，包括攻击模拟、防御方案设计等
强调编程能力和框架使用经验，列出熟悉的技术栈及实际应用场景
展示对对齐技术（SFT/RLHF/DPO）的理解及在安全方向的应用思考
如果有安全攻防或红队经验，务必详细描述角色与成果
补充Red Team实战经验，可参与开源安全项目或自建测试环境练习
深入阅读AI安全顶会论文，了解最新攻击向量和防御技术

面试指南

对于攻击防御类问题，建议采用“攻击原理-危害-防御方案-局限性”结构回答
对于系统设计类问题，使用STAR原则：情境-任务-行动-结果，突出个人贡献
对于开放性问题，先明确问题边界，再提出分阶段或分模块的思路
请详细描述Prompt Injection攻击的原理、分类以及如何防御？
如何检测一个Agent是否被越权调用或存在数据泄露风险？
在RLHF训练中，如何设计Reward Model来约束模型生成的安全性？
如果让你设计一个针对多轮对话的Red Team测试方案，你会如何做？
请举例说明你在过去项目中遇到的安全挑战及解决方案

职位点评

综合评分

前沿大模型安全岗位，技术成长快，薪资优厚，但工作强度可能较高。

更适合这类人

最适合追求技术成长和前沿探索的求职者，愿意接受高强度工作以换取快速的能力提升和职业发展。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展95

工作生活50

使命价值75

薪资福利

85较高

字节跳动薪资福利在业内具有显著竞争力，且该岗位属于高价值技术方向，预期薪资偏高，能满足补偿性动机。

薪资信号偏高 (25K-45K/月)

成长发展

95较高

岗位涉及大模型安全这一前沿技术领域，技能成长空间极大，且有Red Team实战机会，发展性动机获得高度满足。

技术前沿前沿/新兴技术

技术栈LLM、Agent、Prompt Injection、RLHF、RAG、SFT、DPO

业务类型ambiguous

工作生活

50较低

工作模式为仅现场办公，未提及灵活办公或WLB相关福利，典型互联网大厂节奏，生活化动机满足程度有限。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

75中等

AI安全具有重要的社会价值，保护用户数据安全与模型可信，但岗位本身更偏技术实现，使命导向的体现一般。

行业发展高速增长赛道

社会影响正向社会影响力较高

创新程度积极采用新技术

Watch Jobs

Agent与大模型安全算法工程师-飞书

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

Agent与大模型安全算法工程师-飞书

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

Senior Principal Scientist I, Translational Disease Biology

腾讯游戏-大模型评测专家

预研动作手游-资深文案策划（角色方向）

腾讯游戏-大模型智能评测算法工程师

腾讯游戏-大模型训练框架研发工程师/专家

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

Senior Principal Scientist I, Translational Disease Biology

腾讯游戏-大模型评测专家

预研动作手游-资深文案策划（角色方向）

腾讯游戏-大模型智能评测算法工程师

腾讯游戏-大模型训练框架研发工程师/专家

字节跳动的其他在招职位

字节跳动的其他在招职位