字节跳动的视觉生成算法专家（图像/视频/数字人方向）-国际电商薪资是多少？

该职位薪资范围为 35k–65k（人民币/月）。

视觉生成算法专家（图像/视频/数字人方向）-国际电商的工作地点在哪里？

该职位工作地点位于杭州市。工作形式为仅现场办公。

字节跳动的视觉生成算法专家（图像/视频/数字人方向）-国际电商有什么任职要求？

该职位要求硕士学历及高级经验工作经验。

字节跳动

视觉生成算法专家（图像/视频/数字人方向）-国际电商

立即应聘

视觉生成算法专家（图像/视频/数字人方向）-国际电商

发布于大约 2 个月前

普通员工/个人贡献者

杭州市

高级经验

全职员工

仅现场办公

硕士

研究与开发 (研发)

Autoregressive

多模态

数字人

AIGC

diffusion

Image-To-Video

PyTorch

Ref-To-Video

TensorFlow

AI 估算 · 35k–65k

AIGC算法人才稀缺，字节电商业务需求旺盛，薪资竞争力强，月薪35-65K区间合理。

职位详情

关于这个职位

该职位负责视觉AIGC前沿算法的预研与落地，基于Diffusion、Autoregressive等技术架构，研发图像、视频、数字人的生成与编辑算法，并优化生成质量与可控性

你将参与基础模型的设计、训练与场景优化，最终赋能字节跳动国际电商业务的内容生成

适合对视觉生成有深厚技术积累且追求落地的算法专家

最低要求

硕士学位及以上，计算机、人工智能、数学等相关专业，3年及以上视觉AIGC算法研发经验

深刻理解视觉生成核心技术，熟悉图像、视频、数字人生成技术体系，具备独立技术研判与方案创新能力

熟练掌握PyTorch、TensorFlow等深度学习框架，编程基础扎实，可独立完成模型设计、训练调优工作

动手能力强、有技术追求，逻辑清晰，具备良好的沟通协作能力，能独立承担核心技术攻坚工作

工作职责

负责视觉AIGC前沿算法预研、技术迭代与落地，参与视觉生成基础模型的架构设计、预训练及场景优化，构建稳健、可拓展的视觉生成算法底座

基于Diffusion、Autoregressive等主流架构，研发图像、视频、数字人生成与编辑算法，如Image-to-Video、Ref-to-Video、Image Editing、Video Editing等，优化生成质量、多样性与可控性

跟进多模态、视觉生成前沿技术，结合业务需求设计创新算法方案，完成技术验证与落地，赋能电商、商业场景的内容生成及优化

AI 洞察

优缺点分析

优点

AIGC是当前最热门的赛道之一，技术前沿性强，个人成长空间大
字节跳动为国际化大厂，平台资源丰富，算法落地场景明确（电商内容生成）
团队技术氛围浓厚，能接触到最先进的视觉生成算法框架与大规模训练经验
算法迭代快，需持续跟进最新论文与技术，保持技术敏锐度

缺点 / 挑战

业务压力大，电商场景对生成质量、效率要求高，可能面临高强度工作节奏
需要同时处理研究探索与工程落地，对综合能力要求较高
适合对视觉生成技术有浓厚兴趣、追求技术突破且愿意挑战高难度问题的算法工程师，尤其是有AIGC相关科研或工业经验的求职者

角色解读

技术方向：从算法专家到技术Leader，主导视觉生成核心方向，成为AIGC领域专家
业务方向：深入电商内容生成场景，结合业务需求推动算法落地，向技术产品方向拓展
管理方向：积累带人经验，逐步晋升为团队技术负责人或研发总监
负责视觉AIGC前沿算法的预研与落地，参与基础模型的架构设计、预训练与场景优化
基于Diffusion、Autoregressive等主流架构，研发图像、视频、数字人的生成与编辑算法
跟进多模态与视觉生成前沿技术，结合电商业务需求设计创新方案并完成技术验证
扎实的视觉AIGC算法基础，熟悉Diffusion、Autoregressive等生成模型
精通PyTorch或TensorFlow，能独立完成模型设计与训练调优
具备图像/视频/数字人生成与编辑的实战经验，了解Image-to-Video等技术
较强的技术判断力与创新能力，能独立承担核心技术攻坚

申请策略

面试前了解字节国际电商的业务背景，思考AIGC如何具体赋能商品图生成、视频广告等场景
准备一个完整的项目介绍，从问题定义、方案设计到最终效果，展示技术深度与业务理解
重点突出AIGC相关项目经历，尤其是图像/视频生成、编辑方面的算法设计与落地成果
强调对Diffusion、Autoregressive等主流架构的深入理解与实践，附上技术博客或论文加分
展示模型训练调优经验，包括大规模训练、性能优化等具体量化成果
深入研读最新视觉生成论文（如Sora、Stable Video Diffusion等），并复现关键模型
练习使用PyTorch或TensorFlow搭建完整的生成模型训练管道，掌握分布式训练技巧

面试指南

对于项目介绍类问题，采用STAR法则：情境-任务-行动-结果，突出技术难点与个人贡献
对于算法原理类问题，先概述核心思想，再对比不同方法，最后结合实践经验说明选择理由
对于方案设计类问题，先明确需求与约束，再分模块提出思路，最后评估可行性与潜在风险
请详细介绍一下你参与过的一个视觉生成项目，包括技术选型、训练过程、遇到的挑战及解决方案
谈谈你对Diffusion模型和Autoregressive模型的理解，它们各自的优缺点及适用场景
如何评估生成图像或视频的质量？有哪些常用的评价指标？如何平衡生成多样性与可控性？
在电商场景中，如何利用AIGC技术生成高质量的商品展示图或广告视频？请设计一个初步方案
如果你需要在一个新数据集上训练一个视频生成模型，你会如何规划数据准备、模型设计、训练策略？

职位点评

综合评分

字节电商AIGC算法专家，技术前沿、薪资优厚，但工作强度大、WLB一般。

从薪资福利、成长空间、工作节奏和岗位方向综合评估，方便横向比较。

更适合这类人

最适合追求技术成长、愿意投入高强度工作以换取职业快速发展的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利65

成长发展90

工作生活40

使命价值70

薪资福利

65中等

薪资在行业中属于较高水平，但京东未明确提及福利待遇，且加班文化可能影响整体补偿感受。

薪资信号未披露（AI估算：35K-65K/月）

成长发展

90较高

技术前沿性极强（AIGC），涉及Diffusion等最新架构，且电商业务落地场景明确，成长空间巨大。

技术前沿前沿/新兴技术

技术栈Diffusion、Autoregressive、Image-to-Video、Ref-to-Video、Image Editing、Video Editing、PyTorch、TensorFlow

业务类型profit_center

工作生活

40较低

杭州现场办公，未提及弹性工作或远程选项，互联网大厂加班强度较高，WLB一般。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

70中等

电商内容生成具有商业价值，但社会影响力相对中性，技术本身属于积极创新，有一定意义感。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

字节跳动的其他在招职位

相似职位推荐

Watch Jobs

视觉生成算法专家（图像/视频/数字人方向）-国际电商

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

IDC电气技术设计专家-基础设施（深圳）

后端开发工程师（AI方向）-飞书IM

智能体安全能力专家-云安全

云网络运维工程师

AI芯片系统软件SDK/Tools工程师-系统软件

【REDstar】基础模型算法工程师-Post-training

【REDstar】大模型应用算法工程师- rednote国际化

【REDstar】视觉与多模态算法工程师

算法技术顾问

机器人-算法工程师-机器视觉3D-杭州*

字节跳动的其他在招职位

IDC电气技术设计专家-基础设施（深圳）

后端开发工程师（AI方向）-飞书IM

智能体安全能力专家-云安全

云网络运维工程师

AI芯片系统软件SDK/Tools工程师-系统软件

相似职位推荐

【REDstar】基础模型算法工程师-Post-training

【REDstar】大模型应用算法工程师- rednote国际化

【REDstar】视觉与多模态算法工程师

算法技术顾问

机器人-算法工程师-机器视觉3D-杭州*

视觉生成算法专家（图像/视频/数字人方向）-国际电商

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

IDC电气技术设计专家-基础设施（深圳）

后端开发工程师（AI方向）-飞书IM

智能体安全能力专家-云安全

云网络运维工程师

AI芯片系统软件SDK/Tools工程师-系统软件

相似职位推荐

【REDstar】基础模型算法工程师-Post-training

【REDstar】大模型应用算法工程师- rednote国际化

【REDstar】视觉与多模态算法工程师

算法技术顾问

机器人-算法工程师-机器视觉3D-杭州*

字节跳动的其他在招职位