字节跳动的视觉大模型推理部署工程师-智能创作（北京/上海/杭州/深圳）薪资是多少？

该职位薪资范围为 25k–50k（人民币/月）。

视觉大模型推理部署工程师-智能创作（北京/上海/杭州/深圳）的工作地点在哪里？

该职位工作地点位于北京市、上海市、杭州市、深圳市。工作形式为仅现场办公。

字节跳动的视觉大模型推理部署工程师-智能创作（北京/上海/杭州/深圳）有什么任职要求？

该职位要求学历未注明学历及中级经验工作经验。

字节跳动

视觉大模型推理部署工程师-智能创作（北京/上海/杭州/深圳）

立即应聘

视觉大模型推理部署工程师-智能创作（北京/上海/杭州/深圳）

发布于大约 2 个月前

普通员工/个人贡献者

北京市 / 上海市

中级经验

全职员工

仅现场办公

学历未注明

软件工程

分布式系统

推理优化

模型部署

AIGC

comfyui

GPU

LLM

SGLang

AI 估算 · 25k–50k

字节跳动AI岗位，一线城市，3年经验，薪资竞争力强，中位数约37.5k。

职位详情

关于这个职位

该职位负责视觉大模型（LLM/VLM/AIGC）的推理服务架构设计与部署优化，保障系统高可用和低成本

你将与算法和业务团队合作，推动大模型应用落地

适合对AI工程有热情、具备分布式系统经验的工程师

最低要求

计算机相关专业，拥有3年以上后端/AI工程/分布式系统研发经验

精通Python/Go，具备扎实的AI工程架构设计、性能优化、工程提效能力

了解LLM/VLM/AIGC，对大模型应用层创新和落地有热情

工作职责

负责视觉大模型LLM/VLM/AIGC推理服务架构设计和实现、推理优化、服务部署、应用落地等，保障系统的高可用和低成本

与算法和业务侧产品研发团队合作，确保高标准的产品顺利交付

优先资格

熟悉GPU/NPU硬件特性，具备大规模GPU集群部署优化经验者优先

具备丰富的大模型服务部署经验，熟悉ComfyUI/vLLM/SGLang/Ray，有分布式高并发系统架构经验者优先

AI 洞察

优缺点分析

优点

接触最前沿的大模型技术（LLM/VLM/AIGC），技术成长快
字节跳动平台大，资源丰富，业务场景多样，项目影响力高
团队技术氛围浓厚，与顶尖算法和工程同事合作
薪资待遇在行业内具有竞争力，福利完善
大模型推理优化技术复杂，需要不断学习最新论文和工具

缺点 / 挑战

业务需求变化快，可能面临较大的交付压力
涉及多地协作，沟通成本较高
适合对AI工程有强烈热情、喜欢挑战技术难题、希望在快速发展行业中积累核心竞争力的工程师

角色解读

技术方向：从模型部署工程师成长为AI系统架构师，主导大规模AI平台设计
业务方向：深入理解AI产品需求，转向AI产品经理或技术负责人
专家方向：在推理优化、模型加速领域成为公司核心专家，影响行业标准
设计并实现视觉大模型（LLM/VLM/AIGC）的推理服务架构，包括模型加载、请求调度、结果返回等环节
优化模型推理性能，利用GPU/NPU硬件特性和分布式技术降低延迟和成本
与算法团队合作，将新模型快速部署到生产环境，确保稳定性和可扩展性
参与构建内部工具链，提升模型部署和运维效率
精通Python或Go，具备扎实的工程能力，能够编写高性能、可维护的代码
熟悉分布式系统设计，了解高并发、高可用架构，有大规模集群管理经验
了解LLM/VLM/AIGC等大模型的基本原理和推理流程，掌握常用推理框架如vLLM、SGLang
熟悉GPU/NPU硬件特性和模型优化技术，如量化、剪枝、蒸馏等

申请策略

在简历中清晰标注对字节跳动智能创作业务的理解，展示对该方向的热情
如果有个人技术博客或GitHub项目，最好展示与AI推理相关的内容
突出分布式系统和大规模服务部署的项目经验，尤其是GPU集群相关
详细描述模型推理优化的具体案例，如延迟降低、吞吐提升等量化成果
展示对LLM/VLM/AIGC的理解，例如参与过的相关项目或开源贡献
强调Python/Go编程能力，特别是高并发和性能优化方面的经验
补充学习vLLM、SGLang等主流推理框架的源码和使用
了解GPU/NPU硬件架构和模型加速技术（如TensorRT、ONNX Runtime）

面试指南

STAR方法：描述项目背景、目标、行动和结果，重点突出量化指标
逻辑分层：从架构层面（负载均衡、容错）到技术细节（算子优化、内存管理）
对比分析：比较不同方案的优劣，展示技术判断力
请描述你参与过的一个大模型推理服务架构设计，如何保证高可用和低延迟？
如何优化Transformer模型的推理性能？列举具体技术
LLM推理中的KV Cache是什么？如何管理？
你如何处理分布式推理中的负载均衡和故障恢复？
对vLLM或SGLang的了解？它们解决了什么问题？

职位点评

综合评分

字节AI大模型部署岗，技术前沿、薪资优厚，但工作强度较高，WLB一般。

更适合这类人

该职位最适合追求技术前沿和快速成长的求职者，对薪资和稳定性有较高期望，能接受一定的生活节奏牺牲。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展90

工作生活40

使命价值80

薪资福利

85较高

字节跳动薪资水平在行业内偏高，福利完善，但JD未明确具体薪资和福利，仅凭公司口碑补偿性动机较高。

薪资信号未披露（AI估算：25K-50K/月）

成长发展

90较高

该职位聚焦大模型推理部署这一前沿技术方向，涉及LLM/VLM/AIGC，技术栈新，成长空间大，但未提及晋升机制。

技术前沿前沿/新兴技术

技术栈LLM、VLM、AIGC、GPU、分布式系统、推理优化

业务类型profit_center

工作生活

40较低

JD未明确工作模式，字节跳动通常为现场办公，且可能存在加班文化，但无官方信息。生活化动机满足度较低。

工作模式未明确

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

80较高

AI创作领域处于高速增长赛道，技术推动产品创新，社会影响力中性偏正面，但JD未提及使命感。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

字节跳动

视觉大模型推理部署工程师-智能创作（北京/上海/杭州/深圳）

立即应聘

视觉大模型推理部署工程师-智能创作（北京/上海/杭州/深圳）

发布于大约 2 个月前

普通员工/个人贡献者

北京市 / 上海市

中级经验

全职员工

仅现场办公

学历未注明

软件工程

分布式系统

推理优化

模型部署

AIGC

comfyui

GPU

LLM

SGLang

AI 估算 · 25k–50k

字节跳动AI岗位，一线城市，3年经验，薪资竞争力强，中位数约37.5k。

职位详情

关于这个职位

该职位负责视觉大模型（LLM/VLM/AIGC）的推理服务架构设计与部署优化，保障系统高可用和低成本

你将与算法和业务团队合作，推动大模型应用落地

适合对AI工程有热情、具备分布式系统经验的工程师

最低要求

计算机相关专业，拥有3年以上后端/AI工程/分布式系统研发经验

精通Python/Go，具备扎实的AI工程架构设计、性能优化、工程提效能力

了解LLM/VLM/AIGC，对大模型应用层创新和落地有热情

工作职责

负责视觉大模型LLM/VLM/AIGC推理服务架构设计和实现、推理优化、服务部署、应用落地等，保障系统的高可用和低成本

与算法和业务侧产品研发团队合作，确保高标准的产品顺利交付

优先资格

熟悉GPU/NPU硬件特性，具备大规模GPU集群部署优化经验者优先

具备丰富的大模型服务部署经验，熟悉ComfyUI/vLLM/SGLang/Ray，有分布式高并发系统架构经验者优先

AI 洞察

优缺点分析

优点

接触最前沿的大模型技术（LLM/VLM/AIGC），技术成长快
字节跳动平台大，资源丰富，业务场景多样，项目影响力高
团队技术氛围浓厚，与顶尖算法和工程同事合作
薪资待遇在行业内具有竞争力，福利完善
大模型推理优化技术复杂，需要不断学习最新论文和工具

缺点 / 挑战

业务需求变化快，可能面临较大的交付压力
涉及多地协作，沟通成本较高
适合对AI工程有强烈热情、喜欢挑战技术难题、希望在快速发展行业中积累核心竞争力的工程师

角色解读

技术方向：从模型部署工程师成长为AI系统架构师，主导大规模AI平台设计
业务方向：深入理解AI产品需求，转向AI产品经理或技术负责人
专家方向：在推理优化、模型加速领域成为公司核心专家，影响行业标准
设计并实现视觉大模型（LLM/VLM/AIGC）的推理服务架构，包括模型加载、请求调度、结果返回等环节
优化模型推理性能，利用GPU/NPU硬件特性和分布式技术降低延迟和成本
与算法团队合作，将新模型快速部署到生产环境，确保稳定性和可扩展性
参与构建内部工具链，提升模型部署和运维效率
精通Python或Go，具备扎实的工程能力，能够编写高性能、可维护的代码
熟悉分布式系统设计，了解高并发、高可用架构，有大规模集群管理经验
了解LLM/VLM/AIGC等大模型的基本原理和推理流程，掌握常用推理框架如vLLM、SGLang
熟悉GPU/NPU硬件特性和模型优化技术，如量化、剪枝、蒸馏等

申请策略

在简历中清晰标注对字节跳动智能创作业务的理解，展示对该方向的热情
如果有个人技术博客或GitHub项目，最好展示与AI推理相关的内容
突出分布式系统和大规模服务部署的项目经验，尤其是GPU集群相关
详细描述模型推理优化的具体案例，如延迟降低、吞吐提升等量化成果
展示对LLM/VLM/AIGC的理解，例如参与过的相关项目或开源贡献
强调Python/Go编程能力，特别是高并发和性能优化方面的经验
补充学习vLLM、SGLang等主流推理框架的源码和使用
了解GPU/NPU硬件架构和模型加速技术（如TensorRT、ONNX Runtime）

面试指南

STAR方法：描述项目背景、目标、行动和结果，重点突出量化指标
逻辑分层：从架构层面（负载均衡、容错）到技术细节（算子优化、内存管理）
对比分析：比较不同方案的优劣，展示技术判断力
请描述你参与过的一个大模型推理服务架构设计，如何保证高可用和低延迟？
如何优化Transformer模型的推理性能？列举具体技术
LLM推理中的KV Cache是什么？如何管理？
你如何处理分布式推理中的负载均衡和故障恢复？
对vLLM或SGLang的了解？它们解决了什么问题？

职位点评

综合评分

字节AI大模型部署岗，技术前沿、薪资优厚，但工作强度较高，WLB一般。

更适合这类人

该职位最适合追求技术前沿和快速成长的求职者，对薪资和稳定性有较高期望，能接受一定的生活节奏牺牲。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展90

工作生活40

使命价值80

薪资福利

85较高

字节跳动薪资水平在行业内偏高，福利完善，但JD未明确具体薪资和福利，仅凭公司口碑补偿性动机较高。

薪资信号未披露（AI估算：25K-50K/月）

成长发展

90较高

该职位聚焦大模型推理部署这一前沿技术方向，涉及LLM/VLM/AIGC，技术栈新，成长空间大，但未提及晋升机制。

技术前沿前沿/新兴技术

技术栈LLM、VLM、AIGC、GPU、分布式系统、推理优化

业务类型profit_center

工作生活

40较低

JD未明确工作模式，字节跳动通常为现场办公，且可能存在加班文化，但无官方信息。生活化动机满足度较低。

工作模式未明确

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

80较高

AI创作领域处于高速增长赛道，技术推动产品创新，社会影响力中性偏正面，但JD未提及使命感。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

视觉大模型推理部署工程师-智能创作（北京/上海/杭州/深圳）

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

视觉大模型推理部署工程师-智能创作（北京/上海/杭州/深圳）

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

Industrial Engineering ES

专家工程师（MPT）

高级软件开发工程师-配送引擎

资深研发工程师（商品&商家）

高级golang研发工程师

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

Industrial Engineering ES

专家工程师（MPT）

高级软件开发工程师-配送引擎

资深研发工程师（商品&商家）

高级golang研发工程师

字节跳动的其他在招职位

字节跳动的其他在招职位