Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
多模态大模型推理服务研发工程师-Data AML(北京/上海/杭州/深圳)
立即应聘

多模态大模型推理服务研发工程师-Data AML(北京/上海/杭州/深圳)

发布于 大约 10 小时前

普通员工/个人贡献者

北京市 / 上海市
中级经验
全职员工
仅现场办公
本科
分布式系统
GPU
性能优化
RPC
GO
多模态
大模型推理
Serving系统

AI 估算 · 30k–50k

一线城市大厂大模型方向,技术门槛高,市场稀缺,薪资竞争力强,中位数约40k/月,年终绩效良好。

职位详情

关于这个职位

该职位负责多模态大模型(如Seedance、Seedream)在线推理服务的研发与优化,涉及高并发、低延迟的Serving系统设计,以及推理框架、服务架构、性能优化等核心工作

适合对AI推理系统有浓厚兴趣、具备扎实后端开发经验的技术人才

最低要求

计算机相关专业本科及以上学历,精通Go/Python/C++中至少一门,具备良好的系统设计与编码能力

扎实的后端开发基础:熟悉高并发服务架构设计,有RPC框架、异步并发、连接池、限流熔断等实战经验
熟悉分布式系统核心概念:负载均衡、服务发现、消息队列、分布式缓存等,能独立设计和落地高可用服务
具备性能分析与调优意识:熟悉Profiling工具,有系统级性能瓶颈定位和优化经验
对大模型推理服务有浓厚兴趣,具备较强的自驱力、学习能力和跨团队协作能力

工作职责

在线推理服务开发:负责Seedance、Seedream、Seed3D等SOTA模型在线Serving系统的设计与开发,构建高并发、低延迟、高可用的推理服务,支撑多模态、视频生成等模型的线上实时推理

推理框架研发:参与推理框架功能开发,包括请求调度、模型并行(TP/PP)、多模型混合部署等能力建设
服务架构演进:设计并落地推理服务的核心架构,涵盖流量调度、负载均衡、弹性扩缩容等,保障大规模GPU集群上的服务稳定性
性能与效率优化:针对端到端推理链路进行系统级优化,提升GPU利用率、提升服务吞吐
工程质量与稳定性:主导推理服务的可观测性建设(监控、告警、链路追踪),参与线上问题诊断与专项治理,持续提升系统稳定性和运维效率

优先资格

有大模型在线推理服务实战经验

了解主流模型架构(Transformer/DiT/MoE)及推理优化技术
有在线服务研发经验,处理过GPU集群调度问题
有推理框架插件开发或模型Serving工具链建设经验

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,可接触到大规模GPU集群和海量用户场景
  • 团队技术氛围浓厚,与顶尖工程师合作,有机会参与顶级AI产品的核心研发
  • 技术栈更新快,需要持续学习大模型推理优化领域的新技术
  • 适合对AI系统有强烈热情、技术自驱力强、愿意深耕推理性能优化的后端工程师或系统工程师

缺点 / 挑战

  • 身处AI大模型最前沿方向,技术挑战大,成长速度快,市场价值高
  • 需要应对高并发、低延迟的极致性能要求,线上问题排查压力较大
  • 跨团队协作频繁,沟通成本较高

角色解读

  • 技术纵深发展:成为大模型推理系统领域的专家,主导核心技术架构设计
  • 横向扩展:深入理解多模态模型与硬件的协同优化,向AI系统工程师方向发展
  • 管理路线:带领团队负责推理服务方向,逐步转型为技术Leader或架构师
  • 设计和开发高并发、低延迟的多模态大模型在线推理服务,支撑面向用户的实时生成任务
  • 参与推理框架的功能迭代,实现请求调度、模型并行等核心机制,提升系统吞吐
  • 主导服务架构的演进,包括流量管理、弹性扩缩容等,保障大规模GPU集群稳定运行
  • 进行系统级性能分析与优化,提升GPU利用率,降低推理延迟
  • 精通Go/Python/C++中至少一门语言,具备扎实的编码和系统设计能力
  • 熟悉高并发服务架构,有RPC、异步、连接池、限流熔断等实战经验
  • 掌握分布式系统核心概念:负载均衡、服务发现、缓存、消息队列等
  • 具备性能调优意识,熟练使用Profiling工具,能定位系统瓶颈

申请策略

  • 在简历中明确表达对大模型推理的兴趣,并结合自身经历说明为什么适合
  • 关注字节跳动旗下AI产品(如豆包、剪映等),在面试中展现对业务的理解
  • 重点突出高并发后端服务的架构设计经验,尤其是实际落地的性能优化案例
  • 强调对分布式系统的理解,如负载均衡、缓存策略等,最好有数据支撑
  • 如果有大模型相关项目(如模型部署、推理加速),务必详细描述
  • 展示代码能力,如GitHub链接或技术博客,体现对Go/Python/C++的熟练度
  • 补充学习大模型推理框架(如vLLM、TensorRT-LLM)的原理和使用
  • 深入学习GPU编程或CUDA优化技术,了解模型并行策略

面试指南

  • 使用STAR法则:描述场景、任务、行动、结果,量化优化效果(如延迟降低X%,吞吐提升Y%)
  • 从系统设计角度分层回答:客户端-网络-服务层-模型推理-硬件,逐一分析潜在瓶颈及解决方案
  • 结合实践经验:提到具体框架(如Kubernetes、gRPC)和工具(如pprof、perf),展示动手能力
  • 描述一次你如何设计一个高并发、低延迟的在线服务,并举例说明如何优化性能
  • 解释模型并行(TP/PP)的工作原理,以及在大模型推理中如何应用
  • 如何处理GPU集群中的服务稳定性问题?比如某个节点故障如何保证服务不中断?
  • 你用过哪些性能分析工具?如何定位系统瓶颈?
  • 对Transformer、MoE等模型架构的理解,以及对推理优化的看法

匹配度报告

74
综合匹配度

一线大厂大模型核心技术岗,薪资优厚,发展空间极大,但工作强度较高,WLB一般。

适合人群
适合将技术成长和前沿探索置于首位、愿意接受高强度挑战的工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值75

薪资福利匹配

85较高

该职位薪资在行业中属于较高水平,字节跳动福利体系完善(如六险一金、免费餐食),但具体薪资未在JD中披露,需面试后确定。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

95较高

该职位处于大模型技术最前沿,工作内容涵盖系统架构、性能优化等核心领域,技术成长空间极大。字节跳动内部有完善的培训和技术分享机制。

技术前沿前沿/新兴技术
技术栈多模态大模型、推理优化、GPU集群、TP/PP、分布式系统
业务类型ambiguous

工作生活匹配

40较低

字节跳动整体工作节奏较快,JD未提远程或弹性办公,通常要求现场办公,且大模型推理服务需要及时响应线上问题,可能存在一定加班压力。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

75中等

大模型是当前最具变革性的技术,推动AI落地有较高社会价值,但字节跳动商业导向明显,具体使命感因人而异。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 直播高级产品经理(激励增长方向)-抖音直播

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 资深架构师(机审方向)-国际化内容安全平台

    字节跳动 · 上海市
    AI 估算 · 50k-70k
  • 豆包AI大模型数据分析-火山方舟MaaS

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 商业产品经理(线索闭环化方向)-抖音生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • AI应用开发工程师-Cross Platform

    字节跳动 · 上海市
    AI 估算 · 30k-50k

字节跳动 的其他在招职位

  • 直播高级产品经理(激励增长方向)-抖音直播

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 资深架构师(机审方向)-国际化内容安全平台

    字节跳动 · 上海市
    AI 估算 · 50k-70k
  • 豆包AI大模型数据分析-火山方舟MaaS

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 商业产品经理(线索闭环化方向)-抖音生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • AI应用开发工程师-Cross Platform

    字节跳动 · 上海市
    AI 估算 · 30k-50k