ByteDance logo
字节跳动
网络安全大模型算法研究员-Seed

网络安全大模型算法研究员-Seed

发布于 大约 9 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
博士
网络安全
PyTorch
强化学习
LLM
渗透测试
CTF
漏洞挖掘
Agent系统
Reverse Engineering
Binary Exploitation

AI 估算 · 40k–80k

字节跳动核心算法岗,要求博士或有突出经验,薪资竞争力强,月薪中位数60K,按15薪计算年薪约90万。

职位详情

关于这个职位

该职位专注于利用大语言模型(LLM)和强化学习(RL)构建网络安全智能体,用于自动化渗透测试与漏洞修复

你将研究AI Agent在复杂安全环境中的应用,处理CTF、漏洞数据等实战数据
适合具备扎实机器学习基础且热爱安全攻防的研究型人才

最低要求

扎实的机器学习/深度学习基础,熟悉LLM或强化学习(RL)

)拥有机器学习/网络安全相关的博士研究生学历
)或者1年以上LLM+网络安全研究工作经验,做出过领域突出贡献
熟练使用PyTorch、VeRL等机器学习框架,有丰富LLM、Agent系统或RL训练经验
具备真实网络安全研究经验,例如参与过CTF竞赛(如DEFCON CTF、XCTF、强网杯、RealWorld CTF等)并取得较好成绩或具有丰富的漏洞挖掘、渗透测试、Binary Exploitation、Reverse Engineering等实战经验
熟悉Linux环境和常见安全研究工具,具备优秀的工程能力
具备良好的职业操守和安全伦理意识,仅在合法授权范围内开展安全研究,遵守相关法律法规和负责任披露原则,不从事任何破坏性或非法安全活动

工作职责

研究和构建基于LLM与强化学习的网络安全智能体(AI Security Agents),用于渗透测试和漏洞修复等

设计和实现Agent系统与强化学习训练环境,在模拟或真实安全环境中训练和评估安全智能体
利用网络安全数据(如CTF题目、系统日志、漏洞数据和攻击行为数据)构建机器学习模型

AI 洞察

优缺点分析

优点

  • 处于AI+安全前沿交叉领域,技术壁垒高,个人成长空间大
  • 字节跳动大平台,资源丰富,可接触海量真实安全数据与场景
  • 薪资待遇优厚,博士或突出经验者享有竞争力薪酬和股票期权
  • 团队技术氛围浓厚,与顶尖安全研究者和算法工程师共事
  • 职位要求极高,需同时具备扎实的算法能力和安全实战经验,入门门槛高
  • 安全领域对抗性强,问题复杂,需要持续学习和跟踪最新攻防技术
  • 可能面临高强度工作节奏,尤其是在项目落地或竞赛准备期间
  • 适合拥有博士学历或丰富安全攻防经验,且对AI与安全交叉领域有浓厚兴趣的研究型技术人才

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术纵深:从研究员成长为AI安全领域的专家,主导关键算法突破
  • 管理路线:有机会带领小团队,逐步晋升为技术Leader或研究负责人
  • 横向发展:可向安全产品化、安全架构或跨领域AI应用方向拓展
  • 研究并构建基于LLM和强化学习的AI安全智能体,实现自动化渗透测试与漏洞修复
  • 设计和实现Agent系统及强化学习训练环境,在模拟或真实安全场景中迭代优化模型性能
  • 利用CTF题目、系统日志、漏洞数据等安全相关数据,训练和评估机器学习模型
  • 扎实的机器学习/深度学习基础,精通LLM或强化学习算法原理与实践
  • 熟练使用PyTorch等框架,有丰富的LLM、Agent系统或RL训练经验
  • 具备真实网络安全攻防经验,如CTF竞赛获奖、漏洞挖掘或渗透测试
  • 优秀的工程能力,熟悉Linux环境及常见安全研究工具

申请策略

  • 深入了解字节跳动Seed团队的研究方向,在求职信中表达对AI安全的热情
  • 准备一个完整的安全Agent项目演示或技术博客,展示从思路到实现的闭环能力
  • 突出AI相关成果,如LLM或强化学习方向的论文、开源项目或竞赛经历
  • 重点展示安全实战经验,包括CTF排名、漏洞发现、渗透测试案例等
  • 强调工程能力,尤其是使用PyTorch、Linux等工具的熟练度
  • 体现职业操守,注明安全研究均在合法授权范围内进行
  • 若RL经验不足,可系统学习深度强化学习(如Sutton教材)并在安全环境中实践
  • 补充LLM Agent相关技术,如LangChain、ReAct模式、工具调用等

面试指南

  • STAR方法:描述情境、任务、行动和结果,突出技术细节和贡献
  • 结构化思考:针对设计类问题,先拆解问题要素(环境、动作、奖励),再逐步展开技术方案
  • 体现安全伦理:在回答中主动提及合法授权、负责任披露等原则
  • 请介绍你在LLM或强化学习领域做过的项目,尤其是与安全相关的?
  • 如何设计一个基于RL的自动化渗透测试Agent?请描述状态、动作和奖励函数
  • 你有过CTF竞赛经历吗?讲一次你解决的最有挑战性的题目
  • 在大模型安全应用中,你如何看待对抗性攻击和防御?
  • 假设你要训练一个Agent来自动修复Web漏洞,你会如何构建训练环境和评估指标?

匹配度报告

71
综合匹配度

顶级AI安全研究岗,前沿技术栈,薪资优厚,但工作强度大、WLB一般。

适合人群
最适合追求技术成长和前沿探索的求职者,对薪资和未来发展有高期望,但需接受高强度工作节奏。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利匹配

85较高

字节跳动薪酬在行业内极具竞争力,博士或经验丰富者薪资偏高,福利完善(五险一金、补充医疗、年终奖等),但未在JD中明确列出具体福利。

薪资信号面议 (40K-80K/月)

成长发展匹配

90较高

职位处于AI+安全前沿,技术栈前沿(LLM+RL),成长空间巨大,但JD未明确提及导师制或晋升通道。

技术前沿前沿/新兴技术
技术栈LLM、强化学习、Agent系统、PyTorch、VeRL
业务类型ambiguous

工作生活匹配

40较低

仅现场办公,北京市区核心地段,但未明确WLB信号,互联网大厂算法岗通常加班较多。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

网络安全行业处于高速增长赛道,社会价值较高(防御恶意攻击),但JD未提及使命感或创新突破。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs