ByteDance logo
字节跳动
大模型智能体安全研究员-Flow安全

大模型智能体安全研究员-Flow安全

发布于 大约 17 小时前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
本科
RAG
LLM
威胁建模
AI安全
红队测试
对抗性测试
大模型
智能体
Agent框架
安全评测

AI 估算 · 35k–60k

该职位需前沿AI安全技术能力,市场稀缺,薪资竞争力强,深圳大厂标准。

职位详情

关于这个职位

该职位专注于大模型智能体系统的安全研究,包括风险发现、防护策略设计、安全评测与红队测试

你将深入探索Prompt注入、工具调用越权等前沿攻击面,并构建自动化防御体系
适合对AI安全充满热情、具备攻防实战经验的技术人才

最低要求

专业背景:计算机科学、信息安全、人工智能、网络安全或相关领域本科及以上学历,或具备同等水平的实际工作经验与技术能力

大模型技术理解:熟悉大语言模型(LLM)的基本原理与推理机制,了解主流Agent框架及其工作模式(如基于工具调用的ReAct/Function Calling范式、多步工作流编排、插件系统、RAG架构等)
AI安全知识储备:了解当前主流的AI安全问题与攻防方法,包括但不限于Prompt Injection(直接注入与间接注入)、Jailbreak、数据投毒、模型逆向、对抗样本、模型滥用及越权调用第三方服务等攻击手段与防御思路
安全攻防或威胁建模经验:具备一定的安全研究、渗透测试、红队演练或威胁建模经验,能够从攻击者视角系统性地分析复杂系统的安全风险面
代码实现能力:具备扎实的编程能力(Python为主,其他语言加分),能独立构建概念验证(PoC)、安全测试脚本、自动化评估工具或对抗性测试框架
逻辑抽象与分析能力:具有优秀的问题抽象能力和结构化思维,能够将模糊的、新兴的安全风险转化为清晰的威胁模型、评估指标和可执行的防护方案
风险意识与安全直觉:对新技术、新场景保持敏锐的安全嗅觉,能够主动识别潜在风险点,而非仅被动响应已知漏洞
跨团队沟通与协作:具备良好的书面和口头表达能力,能够清晰地向非安全背景的技术和业务团队传达安全风险与建议,推动安全方案的落地执行

工作职责

智能体安全风险发现、建模与评估:针对大模型智能体系统(含工具调用、插件集成、多步工作流编排等场景),系统性地发现和建模安全风险,包括但不限于Prompt Injection(直接/间接注入)、指令绕过、越权调用外部工具或第三方服务、敏感数据泄露、上下文污染、模型幻觉与推理偏差引发的业务风险等

建立风险分级与影响评估框架,制定安全基线标准与准入规范
防护策略与安全机制设计:结合威胁模型与业务场景,设计并迭代智能体系统的安全防护架构与策略规则体系,涵盖输入输出过滤、Prompt防护层、工具调用权限沙箱、上下文隔离、敏感操作审批、安全对齐(Alignment)策略以及基于意图识别的异常行为检测等方向
安全评测体系建设与红队测试:构建覆盖大模型智能体核心攻击面的标准化安全评测基准(Benchmark),组织和执行红队测试(Red Teaming),开发自动化攻击模拟工具与对抗性测试框架,持续验证并推动防护能力的工程化与规模化
前沿安全研究与情报跟踪:持续跟踪AI安全领域的最新学术研究、攻击技术演进与行业安全事件,提炼可落地的防护思路与方法论,保持团队在大模型安全攻防方面的技术前瞻性
跨团队协作与安全能力落地:与产品、工程、算法及合规团队紧密协作,将安全研究成果转化为可工程化的安全组件和规范流程,推动安全能力在智能体产品全链路中的系统性集成与持续运营

优先资格

实际LLM/Agent安全经验:有大模型应用或智能体系统的安全研究、攻防测试或安全治理的实战经验,曾主导或深度参与过相关安全项目

学术成果或开源贡献:在AI安全、对抗机器学习、系统安全等领域发表过高质量学术论文(如顶会S&P、USENIX Security、CCS、NeurIPS、ICML、ACL等),或在相关开源项目中有持续贡献
安全竞赛成绩:在CTF、AI安全挑战赛、红队竞赛或漏洞挖掘项目中取得优异成绩,具备竞技型安全攻防实力
安全工程化能力:有将安全研究成果转化为自动化工具、平台化能力或规模化服务的工程经验
多领域交叉背景:同时具备传统网络安全/应用安全与AI/NLP技术背景,能够将经典安全思维与大模型场景有机结合
行业影响力:在AI安全社区有一定影响力,如维护技术博客、参与行业标准制定、在安全会议上发表演讲等

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,有机会接触大规模智能体系统实际场景
  • 团队氛围技术导向,鼓励研究和创新,有发表顶会论文和参与社区的机会
  • 薪资福利优厚,股票期权等长期激励,职业发展空间大
  • 领域属于新兴方向,安全标准和方法论尚不成熟,需要较强的自我驱动和探索能力

缺点 / 挑战

  • 聚焦最前沿的AI安全领域,技术挑战大,学习曲线陡峭,快速提升行业价值
  • 攻击技术演变快,需持续跟踪最新研究,保持技术敏感度,工作强度可能较高
  • 跨团队协作要求高,需要向非安全背景同事清晰传递风险,推动落地可能遇到阻力
  • 适合对AI安全有浓厚兴趣、具备扎实攻防背景和编程能力、喜欢挑战前沿问题的技术型人才

角色解读

  • 深入AI安全攻防领域,成为大模型安全方向的技术专家
  • 向安全架构师或团队技术负责人发展,负责整体安全体系设计
  • 可横向拓展至AI产品安全、合规或更广阔的网络安全领域
  • 系统性发现和建模大模型智能体系统的安全风险,如Prompt注入、工具调用越权等
  • 设计并迭代防护策略与安全机制,包括输入输出过滤、权限沙箱、异常行为检测
  • 构建标准化安全评测基准,组织红队测试,开发自动化攻击模拟工具
  • 跟踪前沿AI安全研究,与产品、工程团队协作将安全方案落地
  • 熟悉LLM原理及Agent框架(ReAct/Function Calling/RAG),了解主流攻击手法
  • 扎实的Python编程能力,能独立构建PoC、测试脚本和自动化工具
  • 具备安全研究、渗透测试或威胁建模经验,能从攻击者视角分析系统风险
  • 优秀的逻辑抽象和结构化思维,能将模糊风险转化为可执行的防护方案

申请策略

  • 准备一份技术博客或研究笔记,展示对AI安全的理解,会增加竞争力
  • 了解字节跳动旗下智能体产品(如豆包、Coze),提前思考其安全挑战
  • 突出AI安全相关项目经验,如大模型攻防、Prompt注入防御、Agent安全评估等
  • 展示编程能力:提供GitHub链接或具体工具开发案例,如自动化测试框架
  • 列举学术发表或开源贡献,尤其与AI安全相关顶会论文或社区贡献
  • 强调红队演练、CTF竞赛成绩或漏洞挖掘经历,体现实战能力
  • 深入学习LLM原理和主流Agent框架(如LangChain、AutoGPT),实践构建Agent并测试安全性
  • 系统梳理AI安全攻击手法(Prompt注入、越狱、数据投毒等),并尝试复现和防御

面试指南

  • 对于攻击或防御问题,先定义场景,然后分析攻击原理和影响,再给出多层防御策略(输入侧、模型侧、输出侧)
  • 对于开放性问题,使用结构化回答:问题背景 → 方法论 → 具体案例 → 效果与反思
  • 对于设计类问题,采用威胁建模思路:资产识别 → 攻击面分析 → 风险优先级 → 防护方案设计
  • 请解释一种Prompt Injection攻击方式,并描述如何防御
  • 如何对一个大模型智能体系统进行安全评估?请设计一个基准测试
  • 描述一个你曾经处理过的安全漏洞或红队项目,你发现了什么风险?如何解决的?
  • 在Agent调用外部工具时,如何防止权限越界和数据泄露?
  • 你如何看待当前AI安全领域的最大挑战?未来趋势是什么?

匹配度报告

72
综合匹配度

前沿AI安全研究岗,技术成长空间极大,薪资优厚,但工作强度可能较高。

适合人群
最适合追求技术成长和前沿挑战的求职者,愿意为职业发展投入时间和精力,不过分看重工作生活平衡。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活45
使命价值70

薪资福利匹配

85较高

字节跳动提供有竞争力的薪资和福利,但JD未明确具体数值,薪资信号为未披露,整体补偿性动机满足度较高。

薪资信号未披露(AI估算:35K-60K/月)

成长发展匹配

90较高

职位专注前沿AI安全领域,技术栈前沿,成长机会多,JD明确提到跟踪前沿研究、红队测试等,发展性动机满足度高。

技术前沿前沿/新兴技术
技术栈大模型、LLM、Agent、Prompt Injection、红队测试、Python
成长机会前沿安全研究、持续跟踪最新学术研究
业务类型ambiguous

工作生活匹配

45较低

工作地点仅现场办公,JD未提及弹性工时或远程政策,深圳互联网大厂可能加班较强,生活方式满足度一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI安全领域属于高速增长赛道,对社会有正向影响(防止AI滥用),但JD未明确使命导向,意义感满足度中等偏上。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度开拓性创新(行业首创)
Watch Jobs