Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
视觉大模型推理部署工程师-智能创作(北京/上海/杭州/深圳)
立即应聘

视觉大模型推理部署工程师-智能创作(北京/上海/杭州/深圳)

发布于 大约 14 小时前

普通员工/个人贡献者

北京市 / 上海市
中级经验
全职员工
仅现场办公
学历未注明
分布式系统
GPU
GO
LLM
模型部署
AIGC
推理优化
VLM
SGLang
vLLM

AI 估算 · 25k–50k

字节跳动AI岗位,一线城市,3年经验,薪资竞争力强,中位数约37.5k。

职位详情

关于这个职位

该职位负责视觉大模型(LLM/VLM/AIGC)的推理服务架构设计与部署优化,保障系统高可用和低成本

你将与算法和业务团队合作,推动大模型应用落地
适合对AI工程有热情、具备分布式系统经验的工程师

最低要求

计算机相关专业,拥有3年以上后端/AI工程/分布式系统研发经验

精通Python/Go,具备扎实的AI工程架构设计、性能优化、工程提效能力
了解LLM/VLM/AIGC,对大模型应用层创新和落地有热情

工作职责

负责视觉大模型LLM/VLM/AIGC推理服务架构设计和实现、推理优化、服务部署、应用落地等,保障系统的高可用和低成本

与算法和业务侧产品研发团队合作,确保高标准的产品顺利交付

优先资格

熟悉GPU/NPU硬件特性,具备大规模GPU集群部署优化经验者优先

具备丰富的大模型服务部署经验,熟悉ComfyUI/vLLM/SGLang/Ray,有分布式高并发系统架构经验者优先

AI 洞察

优缺点分析

优点

  • 接触最前沿的大模型技术(LLM/VLM/AIGC),技术成长快
  • 字节跳动平台大,资源丰富,业务场景多样,项目影响力高
  • 团队技术氛围浓厚,与顶尖算法和工程同事合作
  • 薪资待遇在行业内具有竞争力,福利完善
  • 大模型推理优化技术复杂,需要不断学习最新论文和工具

缺点 / 挑战

  • 业务需求变化快,可能面临较大的交付压力
  • 涉及多地协作,沟通成本较高
  • 适合对AI工程有强烈热情、喜欢挑战技术难题、希望在快速发展行业中积累核心竞争力的工程师

角色解读

  • 技术方向:从模型部署工程师成长为AI系统架构师,主导大规模AI平台设计
  • 业务方向:深入理解AI产品需求,转向AI产品经理或技术负责人
  • 专家方向:在推理优化、模型加速领域成为公司核心专家,影响行业标准
  • 设计并实现视觉大模型(LLM/VLM/AIGC)的推理服务架构,包括模型加载、请求调度、结果返回等环节
  • 优化模型推理性能,利用GPU/NPU硬件特性和分布式技术降低延迟和成本
  • 与算法团队合作,将新模型快速部署到生产环境,确保稳定性和可扩展性
  • 参与构建内部工具链,提升模型部署和运维效率
  • 精通Python或Go,具备扎实的工程能力,能够编写高性能、可维护的代码
  • 熟悉分布式系统设计,了解高并发、高可用架构,有大规模集群管理经验
  • 了解LLM/VLM/AIGC等大模型的基本原理和推理流程,掌握常用推理框架如vLLM、SGLang
  • 熟悉GPU/NPU硬件特性和模型优化技术,如量化、剪枝、蒸馏等

申请策略

  • 在简历中清晰标注对字节跳动智能创作业务的理解,展示对该方向的热情
  • 如果有个人技术博客或GitHub项目,最好展示与AI推理相关的内容
  • 突出分布式系统和大规模服务部署的项目经验,尤其是GPU集群相关
  • 详细描述模型推理优化的具体案例,如延迟降低、吞吐提升等量化成果
  • 展示对LLM/VLM/AIGC的理解,例如参与过的相关项目或开源贡献
  • 强调Python/Go编程能力,特别是高并发和性能优化方面的经验
  • 补充学习vLLM、SGLang等主流推理框架的源码和使用
  • 了解GPU/NPU硬件架构和模型加速技术(如TensorRT、ONNX Runtime)

面试指南

  • STAR方法:描述项目背景、目标、行动和结果,重点突出量化指标
  • 逻辑分层:从架构层面(负载均衡、容错)到技术细节(算子优化、内存管理)
  • 对比分析:比较不同方案的优劣,展示技术判断力
  • 请描述你参与过的一个大模型推理服务架构设计,如何保证高可用和低延迟?
  • 如何优化Transformer模型的推理性能?列举具体技术
  • LLM推理中的KV Cache是什么?如何管理?
  • 你如何处理分布式推理中的负载均衡和故障恢复?
  • 对vLLM或SGLang的了解?它们解决了什么问题?

匹配度报告

74
综合匹配度

字节AI大模型部署岗,技术前沿、薪资优厚,但工作强度较高,WLB一般。

适合人群
该职位最适合追求技术前沿和快速成长的求职者,对薪资和稳定性有较高期望,能接受一定的生活节奏牺牲。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值80

薪资福利匹配

85较高

字节跳动薪资水平在行业内偏高,福利完善,但JD未明确具体薪资和福利,仅凭公司口碑补偿性动机较高。

薪资信号未披露(AI估算:25K-50K/月)

成长发展匹配

90较高

该职位聚焦大模型推理部署这一前沿技术方向,涉及LLM/VLM/AIGC,技术栈新,成长空间大,但未提及晋升机制。

技术前沿前沿/新兴技术
技术栈LLM、VLM、AIGC、GPU、分布式系统、推理优化
业务类型profit_center

工作生活匹配

40较低

JD未明确工作模式,字节跳动通常为现场办公,且可能存在加班文化,但无官方信息。生活化动机满足度较低。

工作模式未明确
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

AI创作领域处于高速增长赛道,技术推动产品创新,社会影响力中性偏正面,但JD未提及使命感。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 物流供应商管理专家-TikTok Shop

    字节跳动 · 珠海市
    AI 估算 · 25k-40k
  • 产品经理(广告信号方向)-国际商业化产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 消息队列产品经理-Data

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家产品运营高级经理-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • CRM产品经理(AI方向)-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-55k

字节跳动 的其他在招职位

  • 物流供应商管理专家-TikTok Shop

    字节跳动 · 珠海市
    AI 估算 · 25k-40k
  • 产品经理(广告信号方向)-国际商业化产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 消息队列产品经理-Data

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家产品运营高级经理-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • CRM产品经理(AI方向)-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-55k