Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
数字人生成算法工程师-抖音直播(北京/深圳)
立即应聘

数字人生成算法工程师-抖音直播(北京/深圳)

发布于 大约 10 小时前

普通员工/个人贡献者

北京市 / 深圳市
中级经验
全职员工
仅现场办公
本科
PyTorch
TensorFlow
扩散模型
动作捕捉
多模态数据
GAN
3D人体姿态估计
2D数字人生成
Talking Head
面部表情识别

AI 估算 · 25k–50k

字节跳动大厂薪资竞争力强,AI数字人方向热门,技能稀缺,薪资水平处于行业领先位置。

职位详情

关于这个职位

负责抖音直播2D数字人生成算法模型的后训练、应用落地及多模态数据构建与评测,推动数字人技术在实际业务中的创新应用

需要具备图像生成、面部表情识别、动作捕捉等深度学习技术经验,适合对AI数字人方向有深入研究和实践经验的算法工程师

最低要求

本科及以上学历,人工智能、计算机、自动化、数学相关专业

熟悉图片/视频生成GAN/扩散模型、面部表情识别与合成、动作捕捉与合成、3D人体姿态估计等相关技术
在Talking Head生成、人物动作生成、人物表情驱动等领域有深入研究和项目落地经验
良好的沟通协作能力,能够与团队紧密合作,共同推进项目进展
在顶会发表过高质量论文

工作职责

抖音直播的2D数字人生成任务的后训练和应用落地相关的研发

抖音直播的2D数字人生成任务的多模态数据构建、评测标准迭代、及多模态交互创新相关的探索

AI 洞察

优缺点分析

优点

  • 字节跳动大平台,业务场景丰富,技术落地机会多,成长空间大
  • 数字人赛道是AI领域热门方向,技能积累具有高市场价值
  • 团队技术氛围浓厚,与顶尖人才合作,能持续学习前沿技术
  • 算法研究与业务落地结合紧密,需要快速迭代和高效产出,工作节奏可能较快
  • 数字人生成领域技术迭代迅速,需要持续跟进最新论文和开源项目
  • 对跨学科知识要求高(计算机视觉、图形学、多模态),学习成本较大
  • 适合对生成式AI和数字人技术有浓厚兴趣、具备较强动手能力和抗压能力的算法工程师,希望在业务驱动下快速成长

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术方向:从算法工程师成长为AI数字人技术专家,主导核心算法研发
  • 业务方向:深入理解直播业务,晋升为技术负责人或产品技术总监
  • 跨领域:迁移至虚拟人、元宇宙等新兴领域,拓展职业边界
  • 负责2D数字人生成模型的后训练与优化,提升数字人在抖音直播场景中的表现效果
  • 构建多模态数据集,制定评测标准,迭代技术方案以增强数字人的交互真实感
  • 探索面部表情、动作捕捉等前沿技术在直播数字人中的应用,推动产品创新
  • 扎实的深度学习基础,熟练掌握GAN、扩散模型等生成模型理论与实战
  • 熟悉面部表情识别、3D人体姿态估计、动作捕捉等计算机视觉技术
  • 具备Talking Head生成或人物动作生成的完整项目经验,能独立负责算法迭代
  • 良好的工程实现能力,熟练使用PyTorch或TensorFlow,有大规模数据处理经验

申请策略

  • 关注字节跳动AI Lab和抖音直播的技术博客,了解团队技术方向,在面试中体现对业务的思考
  • 准备一个完整的项目案例,从问题定义、方案设计到落地效果,展示端到端能力
  • 突出在Talking Head、动作生成等数字人相关项目中的具体贡献和技术细节,包括模型结构、训练策略、效果指标
  • 展示顶会论文或高质量开源项目,体现学术或工程影响力
  • 强调与业务结合的能力,例如如何将模型优化应用到实际产品中并取得效果
  • 补充3D人体姿态估计和动作捕捉相关技术,熟悉OpenPose、MediaPipe等工具
  • 学习多模态大模型(如CLIP、LLaMA)在数字人中的应用,提升创新视野

面试指南

  • STAR法则:描述情境、任务、行动、结果,突出个人贡献和技术难点
  • 对比分析:比较不同方法的优劣,展现技术深度和决策逻辑
  • 实际案例:结合具体数据或算法改进细节,体现工程落地能力
  • 请详细说明你参与过的数字人生成项目,包括模型选择、训练策略、效果评估
  • 如何评估2D数字人的生成质量?你会设计哪些评测指标?
  • GAN和扩散模型在面部生成中各自的优缺点是什么?你会如何选择?
  • 如何解决数字人视频中的唇形同步问题?请介绍相关技术方案
  • 如果你要离线部署一个实时数字人系统,你会怎么设计工程架构?

匹配度报告

59
综合匹配度

大厂核心业务、前沿数字人技术、高成长空间,但工作强度大、生活平衡差。

适合人群
最适合追求技术成长和前沿创新的求职者,愿意投入高强度工作换取快速提升。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利65
成长发展90
工作生活30
使命价值50

薪资福利匹配

65中等

字节跳动薪资和福利在行业内具有较强竞争力,但JD未明确披露具体待遇,且因公司规模和职级影响,稳定性一般。

薪资信号未披露(AI估算:25K-50K/月)

成长发展匹配

90较高

该职位聚焦前沿AI数字人技术,涉及GAN、扩散模型、多模态等,个人技能成长空间极大,且公司技术底蕴深厚,发展前景广阔。

技术前沿前沿/新兴技术
技术栈GAN、扩散模型、面部表情识别、动作捕捉、3D人体姿态估计、Talking Head、多模态
业务类型profit_center

工作生活匹配

30较低

字节跳动一般为现场办公,且互联网公司工作强度较大,JD未提及弹性工作或WLB,生活平衡受限。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

50较低

数字人技术提升了直播互动体验,具有一定创新性,但主要服务于娱乐场景,社会价值有限。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 消息中间件产品开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 番茄系内容运营-音乐

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 基础框架产品-红果短剧

    字节跳动 · 深圳市
    AI 估算 · 20k-35k
  • XR系统应用开发工程师-移动OS

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • UX设计师-飞书文档

    字节跳动 · 深圳市
    AI 估算 · 15k-30k

字节跳动 的其他在招职位

  • 消息中间件产品开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 番茄系内容运营-音乐

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 基础框架产品-红果短剧

    字节跳动 · 深圳市
    AI 估算 · 20k-35k
  • XR系统应用开发工程师-移动OS

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • UX设计师-飞书文档

    字节跳动 · 深圳市
    AI 估算 · 15k-30k