
字节跳动
网络安全大模型算法研究员-Seed
网络安全大模型算法研究员-Seed
发布于 大约 9 小时前普通员工/个人贡献者
北京市
高级经验
全职员工
仅现场办公
博士
网络安全
PyTorch
强化学习
LLM
渗透测试
CTF
漏洞挖掘
Agent系统
Reverse Engineering
Binary Exploitation
AI 估算 · 40k–80k
字节跳动核心算法岗,要求博士或有突出经验,薪资竞争力强,月薪中位数60K,按15薪计算年薪约90万。
职位详情
关于这个职位
该职位专注于利用大语言模型(LLM)和强化学习(RL)构建网络安全智能体,用于自动化渗透测试与漏洞修复
你将研究AI Agent在复杂安全环境中的应用,处理CTF、漏洞数据等实战数据
适合具备扎实机器学习基础且热爱安全攻防的研究型人才
最低要求
扎实的机器学习/深度学习基础,熟悉LLM或强化学习(RL)
)拥有机器学习/网络安全相关的博士研究生学历
)或者1年以上LLM+网络安全研究工作经验,做出过领域突出贡献
熟练使用PyTorch、VeRL等机器学习框架,有丰富LLM、Agent系统或RL训练经验
具备真实网络安全研究经验,例如参与过CTF竞赛(如DEFCON CTF、XCTF、强网杯、RealWorld CTF等)并取得较好成绩或具有丰富的漏洞挖掘、渗透测试、Binary Exploitation、Reverse Engineering等实战经验
熟悉Linux环境和常见安全研究工具,具备优秀的工程能力
具备良好的职业操守和安全伦理意识,仅在合法授权范围内开展安全研究,遵守相关法律法规和负责任披露原则,不从事任何破坏性或非法安全活动
工作职责
研究和构建基于LLM与强化学习的网络安全智能体(AI Security Agents),用于渗透测试和漏洞修复等
设计和实现Agent系统与强化学习训练环境,在模拟或真实安全环境中训练和评估安全智能体
利用网络安全数据(如CTF题目、系统日志、漏洞数据和攻击行为数据)构建机器学习模型
AI 洞察
优缺点分析
优点
- 处于AI+安全前沿交叉领域,技术壁垒高,个人成长空间大
- 字节跳动大平台,资源丰富,可接触海量真实安全数据与场景
- 薪资待遇优厚,博士或突出经验者享有竞争力薪酬和股票期权
- 团队技术氛围浓厚,与顶尖安全研究者和算法工程师共事
- 职位要求极高,需同时具备扎实的算法能力和安全实战经验,入门门槛高
- 安全领域对抗性强,问题复杂,需要持续学习和跟踪最新攻防技术
- 可能面临高强度工作节奏,尤其是在项目落地或竞赛准备期间
- 适合拥有博士学历或丰富安全攻防经验,且对AI与安全交叉领域有浓厚兴趣的研究型技术人才
缺点 / 挑战
暂无明显挑战项
角色解读
- 技术纵深:从研究员成长为AI安全领域的专家,主导关键算法突破
- 管理路线:有机会带领小团队,逐步晋升为技术Leader或研究负责人
- 横向发展:可向安全产品化、安全架构或跨领域AI应用方向拓展
- 研究并构建基于LLM和强化学习的AI安全智能体,实现自动化渗透测试与漏洞修复
- 设计和实现Agent系统及强化学习训练环境,在模拟或真实安全场景中迭代优化模型性能
- 利用CTF题目、系统日志、漏洞数据等安全相关数据,训练和评估机器学习模型
- 扎实的机器学习/深度学习基础,精通LLM或强化学习算法原理与实践
- 熟练使用PyTorch等框架,有丰富的LLM、Agent系统或RL训练经验
- 具备真实网络安全攻防经验,如CTF竞赛获奖、漏洞挖掘或渗透测试
- 优秀的工程能力,熟悉Linux环境及常见安全研究工具
申请策略
- 深入了解字节跳动Seed团队的研究方向,在求职信中表达对AI安全的热情
- 准备一个完整的安全Agent项目演示或技术博客,展示从思路到实现的闭环能力
- 突出AI相关成果,如LLM或强化学习方向的论文、开源项目或竞赛经历
- 重点展示安全实战经验,包括CTF排名、漏洞发现、渗透测试案例等
- 强调工程能力,尤其是使用PyTorch、Linux等工具的熟练度
- 体现职业操守,注明安全研究均在合法授权范围内进行
- 若RL经验不足,可系统学习深度强化学习(如Sutton教材)并在安全环境中实践
- 补充LLM Agent相关技术,如LangChain、ReAct模式、工具调用等
面试指南
- STAR方法:描述情境、任务、行动和结果,突出技术细节和贡献
- 结构化思考:针对设计类问题,先拆解问题要素(环境、动作、奖励),再逐步展开技术方案
- 体现安全伦理:在回答中主动提及合法授权、负责任披露等原则
- 请介绍你在LLM或强化学习领域做过的项目,尤其是与安全相关的?
- 如何设计一个基于RL的自动化渗透测试Agent?请描述状态、动作和奖励函数
- 你有过CTF竞赛经历吗?讲一次你解决的最有挑战性的题目
- 在大模型安全应用中,你如何看待对抗性攻击和防御?
- 假设你要训练一个Agent来自动修复Web漏洞,你会如何构建训练环境和评估指标?
匹配度报告
71
综合匹配度
顶级AI安全研究岗,前沿技术栈,薪资优厚,但工作强度大、WLB一般。
适合人群
最适合追求技术成长和前沿探索的求职者,对薪资和未来发展有高期望,但需接受高强度工作节奏。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70
薪资福利匹配
85较高
字节跳动薪酬在行业内极具竞争力,博士或经验丰富者薪资偏高,福利完善(五险一金、补充医疗、年终奖等),但未在JD中明确列出具体福利。
薪资信号面议 (40K-80K/月)
成长发展匹配
90较高
职位处于AI+安全前沿,技术栈前沿(LLM+RL),成长空间巨大,但JD未明确提及导师制或晋升通道。
技术前沿前沿/新兴技术
技术栈LLM、强化学习、Agent系统、PyTorch、VeRL
业务类型ambiguous
工作生活匹配
40较低
仅现场办公,北京市区核心地段,但未明确WLB信号,互联网大厂算法岗通常加班较多。
工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)
使命价值匹配
70中等
网络安全行业处于高速增长赛道,社会价值较高(防御恶意攻击),但JD未提及使命感或创新突破。
行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs