Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型推理服务部署框架资深工程师-智能创作(北京/上海/深圳)
立即应聘

大模型推理服务部署框架资深工程师-智能创作(北京/上海/深圳)

发布于 大约 12 小时前

普通员工/个人贡献者

北京市 / 上海市
高级经验
全职员工
仅现场办公
本科
分布式系统
RPC
GO
GPU优化
LLM
AIGC
VLM
vLLM
大模型推理
comfyui

AI 估算 · 25k–50k

大模型方向人才稀缺,字节薪资竞争力强,资深工程师职位薪资上浮明显。

职位详情

关于这个职位

这是一个大模型推理服务部署框架的资深工程师岗位,负责多模态大模型(LLM/VLM/AIGC)的推理架构设计、性能优化与服务部署,保障系统高可用与低成本

你将与业务团队合作,推动前沿技术落地,适合具备深厚编程功底和分布式系统经验的技术专家

最低要求

计算机科学或相关专业,拥有5年以上软件开发经验

具备5年以上Python/C/C++/Go开发经验,精通至少一种编程语言,具备扎实的软件工程设计技能
具备一定算法背景,了解LLM/VLM/AIGC等,对大模型应用层创新有热情,追求卓越,致力于逼近模型能力边界与硬件理论算力极限
具备丰富的大模型推理服务部署经验,掌握ComfyUI/VLLM/Slang/Ray/RPC等,有分布式高并发系统架构经验者优先

工作职责

负责多模态大模型LLM/VLM/AIGC推理服务架构设计和实现、推理优化、服务部署、应用落地等,保障系统的高可用和低成本

保障中长期技术规划、重点项目规划与执行
与业务侧产品研发团队合作,确保高标准的产品顺利交付

优先资格

了解GPU/NPU硬件特性,具备一定Kernel开发及调优经验者优先

具备出色的沟通和团队协作能力

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,能接触海量业务场景和算力资源,快速提升技术视野
  • 薪酬福利在行业内有竞争力,且有晋升和股权激励机会
  • 技术难度大,需要同时掌握算法、系统、硬件等多领域知识,学习曲线陡峭
  • 大模型领域竞争激烈,需持续跟进最新研究和技术动态
  • 适合具备扎实分布式系统和底层编程背景,对AI推理优化有浓厚兴趣,愿意在高压下快速成长的技术专家

缺点 / 挑战

  • 处于AI大模型最前沿,技术挑战高,技能积累价值大,市场稀缺性强
  • 业务迭代快,可能需要应对高强度开发与紧急问题排查,工作压力较大

角色解读

  • 技术纵深发展:成为大模型推理优化领域的权威专家,主导核心架构演进
  • 管理路线:带领团队负责更大规模推理系统,逐步转向技术管理岗位
  • 跨领域拓展:结合业务理解,转向AI产品架构师或技术总监方向
  • 设计并实现多模态大模型(LLM/VLM/AIGC)的推理服务架构,优化推理性能并降低服务成本
  • 负责推理服务在分布式环境下的部署、监控与高可用保障,解决大规模并发挑战
  • 与产品研发团队协作,将前沿模型能力快速落地到实际产品中并确保交付质量
  • 参与中长期技术规划,探索模型能力边界与硬件算力极限
  • 精通Python、C++或Go,具备扎实的软件工程能力,能编写高性能服务代码
  • 深入理解大模型推理框架如VLLM、Ray、ComfyUI,有分布式系统架构经验
  • 熟悉GPU/NPU硬件特性,有Kernel开发或调优经验者优先
  • 优秀的沟通协作能力,能与跨团队伙伴高效合作

申请策略

  • 在面试前了解字节跳动智能创作相关业务方向(如剪映、抖音特效),准备结合业务的技术方案
  • 强调对模型推理极致性能的追求,展示自己的技术热情和过往成果
  • 突出大模型推理框架(VLLM、Ray等)的实际部署和优化经验,用数据说明性能提升或成本降低
  • 强调分布式系统架构设计经验,尤其是高并发、低延迟系统案例
  • 展示GPU/NPU kernel开发或调优经历,以及性能剖析工具使用
  • 系统学习主流推理框架源码(如vLLM、TensorRT-LLM),理解核心优化策略
  • 动手实践模型量化、剪枝、蒸馏等压缩技术,并了解硬件特性(如NVIDIA CUDA、华为昇腾)

面试指南

  • STAR原则:描述背景、任务、行动、结果,突出量化成果
  • 技术选型框架:从需求出发,对比方案优缺点,列出实验数据支撑
  • 问题解决思路:先定位瓶颈,再针对性优化,最后验证并监控
  • 请详细描述你设计过的一个大模型推理服务架构,包括面临的挑战和优化手段
  • 如何选择推理框架(如VLLM vs TensorRT-LLM)?在不同场景下如何权衡?
  • 分布式系统中如何保证推理服务的高可用性和容错性?
  • 描述一次你通过Kernel优化提升GPU利用率的经历
  • 如何评估和监控推理系统的性能指标?

匹配度报告

74
综合匹配度

字节大模型推理专家岗,高薪高成长,技术前沿性强,但WLB一般。

适合人群
最适合追求技术深度和前沿成长的发展型人才,能承受高强度工作。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值75

薪资福利匹配

85较高

字节跳动作为上市大厂,薪资水平在行业中位于高位,且资深工程师通常享有股权激励,福利完善。

薪资信号未披露(AI估算:25K-50K/月)

成长发展匹配

95较高

该岗位聚焦大模型推理前沿技术,涉及最新框架和硬件优化,技能成长空间极大,且有中长期技术规划职责,晋升路径清晰。

技术前沿前沿/新兴技术
技术栈大模型推理、LLM、VLM、AIGC、VLLM、Ray、GPU优化
成长机会长期技术规划、重点项目规划
业务类型profit_center

工作生活匹配

40较低

职位未提及远程或弹性办公,且互联网大厂研发岗位通常加班较多,WLB一般。办公地点在市中心或科技园,通勤可能便利但时间压力大。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

75中等

大模型技术具有较高社会影响力,推动AI创作工具发展,但具体社会价值信号不强,行业前景极好。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 抖音精选内容研判运营(财经/法律方向)-抖音编辑

    字节跳动 · 北京市
    AI 估算 · 15k-25k
  • 商品质量管控策略专家-抖音电商

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • AI产品运营经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 搜索模型训练产品运营(项目管理)-TikTok

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 菲律宾大促活动运营-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-40k

相似职位推荐

  • 中间件研发工程师-【Serverless】

    快手 · 杭州市
    AI 估算 · 35k-55k
  • 测试

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • 拔尖计划-算力专家

    中国移动 · 上海市
    AI 估算 · 40k-70k
  • 数据开发工程师(数据仓库工程师)

    小红书 · 上海市
    AI 估算 · 25k-40k
  • 音视频策略开发工程师/架构师

    小红书 · 北京市
    AI 估算 · 30k-50k

字节跳动 的其他在招职位

  • 抖音精选内容研判运营(财经/法律方向)-抖音编辑

    字节跳动 · 北京市
    AI 估算 · 15k-25k
  • 商品质量管控策略专家-抖音电商

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • AI产品运营经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 搜索模型训练产品运营(项目管理)-TikTok

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 菲律宾大促活动运营-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-40k

相似职位推荐

  • 中间件研发工程师-【Serverless】

    快手 · 杭州市
    AI 估算 · 35k-55k
  • 测试

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • 拔尖计划-算力专家

    中国移动 · 上海市
    AI 估算 · 40k-70k
  • 数据开发工程师(数据仓库工程师)

    小红书 · 上海市
    AI 估算 · 25k-40k
  • 音视频策略开发工程师/架构师

    小红书 · 北京市
    AI 估算 · 30k-50k