Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI系统性能工程师-国际化内容安全平台
立即应聘

AI系统性能工程师-国际化内容安全平台

发布于 大约 4 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
分布式系统
高性能计算
GPU优化
CUDA
SGLang
vLLM
AI Agent
大模型推理
MoE

AI 估算 · 40k–70k

字节跳动大厂,AI核心岗位,技术难度高,薪资竞争力强,通常16薪。

职位详情

关于这个职位

该职位负责字节跳动国际化内容安全平台中AI系统的性能优化与推理加速,主要涉及多模态推理架构设计、千亿级大模型分布式推理优化、底层算子级CUDA/Triton开发,以及AI Agent在系统调优中的应用

适合对高性能计算、大模型推理有深入理解的技术专家

最低要求

具备2年以上高性能计算、分布式调度系统或大模型推理引擎开发经验,熟悉大模型模型结构

对业界前沿的大模型推理框架(如vLLM、SGLang等)的底层源码有深入理解,具备生产环境下的定制开发与性能调优经验
具备较强的复杂系统架构设计能力,对高并发微服务系统中的异步调度、资源池化、负载均衡有深刻理解与实战经验

工作职责

新一代多模态推理架构设计与开发:面向极其庞大且复杂的线上流量,设计并实现支持海量异构算力的高效全局调度系统

解决真实高并发场景下的计算负载均衡与极致的Batch组装难题
超大规模推理引擎深度优化:面向千亿级(200B+)超大模型以及复杂的视觉语言模型(VLM),开发并优化分布式推理策略(TP/EP/DP等)
在生产环境中突破内存与算力瓶颈,实现业界领先的吞吐量与超低延迟
前沿模型算子级优化:针对前沿业务模型架构(如MoE、各类新型Attention机制、多模态融合层等),开发并打磨高性能底层算子(CUDA/Triton等),深度挖掘硬件潜力
AI驱动的基础设施(AI for AI Infra):探索AI Agent在系统性能调优、全链路一致性校验、部署流水线中的落地,构建高度智能化的大模型服务与运维体系,AI Agent for Kernel Optimization

优先资格

熟悉GPU底层微架构,熟练使用CUDA、Triton、CUTLASS等工具进行算子级别极限优化者优先

有大语言模型优化(PTQ/QAT/KV Cache优化/PD分裂)或多模态模型(VLM)线上工程落地经验者优先

AI 洞察

优缺点分析

优点

  • 字节跳动国际化平台,业务规模大,能积累海量高并发处理经验
  • 薪资待遇优厚,股票期权等福利完善
  • 团队技术氛围浓厚,与顶尖人才共事
  • 技术门槛高,需要持续学习最新架构和优化方法
  • 跨部门协作复杂,需与算法、产品等团队紧密配合
  • 适合具有扎实高性能计算背景、热爱大模型推理优化、追求技术深度、能抗压的工程师

缺点 / 挑战

  • 接触业界最前沿的大模型推理技术,技术挑战高,成长快
  • 工作强度大,可能需要应对线上紧急问题和迭代压力

角色解读

  • 技术方向:从AI系统性能工程师晋升为技术专家或架构师,负责更大规模的AI基础设施
  • 管理方向:带领团队负责AI推理平台的整体研发,成为技术负责人
  • 跨领域:可转向AI芯片设计、自动驾驶等高性能计算相关领域
  • 设计和开发多模态推理架构,处理海量线上流量的算力调度与负载均衡
  • 优化千亿级大模型和VLM的分布式推理策略,提升吞吐量并降低延迟
  • 针对MoE、Attention等前沿模型结构,开发高性能CUDA/Triton算子
  • 探索AI Agent在系统调优和运维中的落地应用,实现智能化基础设施
  • 深入理解大模型结构和推理框架(如vLLM、SGLang)源码
  • 精通高性能计算、分布式系统、异步调度和负载均衡
  • 熟练掌握CUDA、Triton等GPU编程工具,具备算子级优化能力
  • 了解量化、KV Cache优化等大模型加速技术

申请策略

  • 字节跳动重视实际项目经验,建议准备一个端到端的推理优化案例进行技术展示
  • 了解国际化内容安全业务场景,思考AI系统性能提升对业务的价值
  • 突出大模型推理框架(vLLM、SGLang等)的源码阅读或二次开发经历
  • 展示分布式推理(TP/EP/DP)或算子优化的具体项目成果,如性能提升数据
  • 强调CUDA/Triton编程能力,附上GitHub或技术博客链接
  • 提及相关论文阅读或技术大会分享,体现技术热情
  • 深入学习vLLM、SGLang等框架的源码,理解其调度和内存管理
  • 练习CUDA算子编写和优化,关注最新的GPU架构特性(如Hopper、Blackwell)

面试指南

  • 用 STAR 法则(情境、任务、行动、结果)组织项目介绍,重点突出技术难点和量化成果
  • 对于原理性问题,先阐述核心概念,再结合源码或论文细节,最后给出自己的思考
  • 对于优化问题,从算法、访存、并行度等多个维度分析,给出具体优化步骤
  • 请介绍你参与过的一个大模型推理优化项目,具体做了哪些工作,取得了什么效果?
  • 简述vLLM的工作原理以及其PagedAttention的设计思路
  • CUDA编程中,如何优化一个矩阵乘法(GEMM)算子?请列出优化策略
  • 在多节点分布式推理中,如何选择TP/EP/DP的策略?考虑哪些因素?
  • 你对AI Agent在系统调优中的应用有什么看法?请举例说明

匹配度报告

72
综合匹配度

字节大厂核心AI infra岗,前沿技术栈,高薪高成长,但WLB一般。

适合人群
最适合追求技术成长和薪资回报、不在意工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值70

薪资福利匹配

85较高

字节跳动大厂,薪资待遇在行业内具有竞争力,且包含年终奖金和股票期权,但JD未披露具体薪资,整体补偿性较高。

薪资信号未披露(AI估算:40K-70K/月)

成长发展匹配

95较高

职位直接涉及最前沿的大模型推理技术(MoE、VLM、分布式推理等),技术成长空间极大,且JD提到AI for AI Infra等创新方向。

技术前沿前沿/新兴技术
技术栈CUDA、Triton、vLLM、SGLang、MoE、KV Cache、TP/EP/DP、AI Agent
业务类型profit_center

工作生活匹配

40较低

北京现场办公,字节工作强度较大,JD未提及弹性工时或WLB,生活化动机满足度较低。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

国际化内容安全平台具有一定的社会价值,但主要为商业驱动,使命导向不显著。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 资深研发工程师(互动方向)-国际化内容安全平台

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 平台产品营销经理-国际化广告商业平台

    字节跳动 · 深圳市
    AI 估算 · 30k-50k
  • 大语言模型通用Agent研究工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 推荐算法工程师(多端电商)-抖音电商

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • 国际战略专家-TikTok Shop

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发实习生-【主站】

    快手 · 北京市
    AI 估算 · 5k-8k
  • 前端实习岗(J72414)

    百度 · 北京市
    AI 估算 · 6k-10k
  • 大数据研发(J93780)

    百度 · 北京市
    AI 估算 · 25k-45k
  • golang实习开发工程师(J72787)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 算法实习生(J77875)

    百度 · 北京市
    AI 估算 · 4k-6k

字节跳动 的其他在招职位

  • 资深研发工程师(互动方向)-国际化内容安全平台

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 平台产品营销经理-国际化广告商业平台

    字节跳动 · 深圳市
    AI 估算 · 30k-50k
  • 大语言模型通用Agent研究工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 推荐算法工程师(多端电商)-抖音电商

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • 国际战略专家-TikTok Shop

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发实习生-【主站】

    快手 · 北京市
    AI 估算 · 5k-8k
  • 前端实习岗(J72414)

    百度 · 北京市
    AI 估算 · 6k-10k
  • 大数据研发(J93780)

    百度 · 北京市
    AI 估算 · 25k-45k
  • golang实习开发工程师(J72787)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 算法实习生(J77875)

    百度 · 北京市
    AI 估算 · 4k-6k