
字节跳动
视觉生成算法专家(图像/视频/数字人方向)-国际电商
视觉生成算法专家(图像/视频/数字人方向)-国际电商
发布于 大约 2 小时前普通员工/个人贡献者
杭州市
高级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
PyTorch
TensorFlow
多模态
AIGC
数字人
diffusion
Autoregressive
Image-To-Video
Ref-To-Video
AI 估算 · 35k–65k
AIGC算法人才稀缺,字节电商业务需求旺盛,薪资竞争力强,月薪35-65K区间合理。
职位详情
关于这个职位
该职位负责视觉AIGC前沿算法的预研与落地,基于Diffusion、Autoregressive等技术架构,研发图像、视频、数字人的生成与编辑算法,并优化生成质量与可控性
你将参与基础模型的设计、训练与场景优化,最终赋能字节跳动国际电商业务的内容生成
适合对视觉生成有深厚技术积累且追求落地的算法专家
最低要求
硕士学位及以上,计算机、人工智能、数学等相关专业,3年及以上视觉AIGC算法研发经验
深刻理解视觉生成核心技术,熟悉图像、视频、数字人生成技术体系,具备独立技术研判与方案创新能力
熟练掌握PyTorch、TensorFlow等深度学习框架,编程基础扎实,可独立完成模型设计、训练调优工作
动手能力强、有技术追求,逻辑清晰,具备良好的沟通协作能力,能独立承担核心技术攻坚工作
工作职责
负责视觉AIGC前沿算法预研、技术迭代与落地,参与视觉生成基础模型的架构设计、预训练及场景优化,构建稳健、可拓展的视觉生成算法底座
基于Diffusion、Autoregressive等主流架构,研发图像、视频、数字人生成与编辑算法,如Image-to-Video、Ref-to-Video、Image Editing、Video Editing等,优化生成质量、多样性与可控性
跟进多模态、视觉生成前沿技术,结合业务需求设计创新算法方案,完成技术验证与落地,赋能电商、商业场景的内容生成及优化
AI 洞察
优缺点分析
优点
- AIGC是当前最热门的赛道之一,技术前沿性强,个人成长空间大
- 字节跳动为国际化大厂,平台资源丰富,算法落地场景明确(电商内容生成)
- 团队技术氛围浓厚,能接触到最先进的视觉生成算法框架与大规模训练经验
- 算法迭代快,需持续跟进最新论文与技术,保持技术敏锐度
缺点 / 挑战
- 业务压力大,电商场景对生成质量、效率要求高,可能面临高强度工作节奏
- 需要同时处理研究探索与工程落地,对综合能力要求较高
- 适合对视觉生成技术有浓厚兴趣、追求技术突破且愿意挑战高难度问题的算法工程师,尤其是有AIGC相关科研或工业经验的求职者
角色解读
- 技术方向:从算法专家到技术Leader,主导视觉生成核心方向,成为AIGC领域专家
- 业务方向:深入电商内容生成场景,结合业务需求推动算法落地,向技术产品方向拓展
- 管理方向:积累带人经验,逐步晋升为团队技术负责人或研发总监
- 负责视觉AIGC前沿算法的预研与落地,参与基础模型的架构设计、预训练与场景优化
- 基于Diffusion、Autoregressive等主流架构,研发图像、视频、数字人的生成与编辑算法
- 跟进多模态与视觉生成前沿技术,结合电商业务需求设计创新方案并完成技术验证
- 扎实的视觉AIGC算法基础,熟悉Diffusion、Autoregressive等生成模型
- 精通PyTorch或TensorFlow,能独立完成模型设计与训练调优
- 具备图像/视频/数字人生成与编辑的实战经验,了解Image-to-Video等技术
- 较强的技术判断力与创新能力,能独立承担核心技术攻坚
申请策略
- 面试前了解字节国际电商的业务背景,思考AIGC如何具体赋能商品图生成、视频广告等场景
- 准备一个完整的项目介绍,从问题定义、方案设计到最终效果,展示技术深度与业务理解
- 重点突出AIGC相关项目经历,尤其是图像/视频生成、编辑方面的算法设计与落地成果
- 强调对Diffusion、Autoregressive等主流架构的深入理解与实践,附上技术博客或论文加分
- 展示模型训练调优经验,包括大规模训练、性能优化等具体量化成果
- 深入研读最新视觉生成论文(如Sora、Stable Video Diffusion等),并复现关键模型
- 练习使用PyTorch或TensorFlow搭建完整的生成模型训练管道,掌握分布式训练技巧
面试指南
- 对于项目介绍类问题,采用STAR法则:情境-任务-行动-结果,突出技术难点与个人贡献
- 对于算法原理类问题,先概述核心思想,再对比不同方法,最后结合实践经验说明选择理由
- 对于方案设计类问题,先明确需求与约束,再分模块提出思路,最后评估可行性与潜在风险
- 请详细介绍一下你参与过的一个视觉生成项目,包括技术选型、训练过程、遇到的挑战及解决方案
- 谈谈你对Diffusion模型和Autoregressive模型的理解,它们各自的优缺点及适用场景
- 如何评估生成图像或视频的质量?有哪些常用的评价指标?如何平衡生成多样性与可控性?
- 在电商场景中,如何利用AIGC技术生成高质量的商品展示图或广告视频?请设计一个初步方案
- 如果你需要在一个新数据集上训练一个视频生成模型,你会如何规划数据准备、模型设计、训练策略?
匹配度报告
66
综合匹配度
字节电商AIGC算法专家,技术前沿、薪资优厚,但工作强度大、WLB一般。
适合人群
最适合追求技术成长、愿意投入高强度工作以换取职业快速发展的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利65
成长发展90
工作生活40
使命价值70
薪资福利匹配
65中等
薪资在行业中属于较高水平,但京东未明确提及福利待遇,且加班文化可能影响整体补偿感受。
薪资信号未披露(AI估算:35K-65K/月)
成长发展匹配
90较高
技术前沿性极强(AIGC),涉及Diffusion等最新架构,且电商业务落地场景明确,成长空间巨大。
技术前沿前沿/新兴技术
技术栈Diffusion、Autoregressive、Image-to-Video、Ref-to-Video、Image Editing、Video Editing、PyTorch、TensorFlow
业务类型profit_center
工作生活匹配
40较低
杭州现场办公,未提及弹性工作或远程选项,互联网大厂加班强度较高,WLB一般。
工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)
使命价值匹配
70中等
电商内容生成具有商业价值,但社会影响力相对中性,技术本身属于积极创新,有一定意义感。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
字节跳动 的其他在招职位
相似职位推荐
Watch Jobs