Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
数字人模型工程技术专家-抖音直播(深圳/北京)
立即应聘

数字人模型工程技术专家-抖音直播(深圳/北京)

发布于 大约 9 小时前

普通员工/个人贡献者

北京市 / 深圳市
高级经验
全职员工
仅现场办公
学历未注明
GO
多模态
CUDA
分布式训练
推理优化
DeepSpeed
vLLM
TRT-LLM
Megatron

AI 估算 · 50k–80k

大模型方向高级岗位薪资高,字节薪资在行业领先,结合岗位要求高,预计月薪5-8万

职位详情

关于这个职位

该职位负责抖音AI分身数字人的多模态理解与生成算法工程优化,包括训练推理加速和模型大规模部署

你将与算法团队紧密合作,提升实时互动模型效果,打造下一代直播互动体验
适合有大模型系统工程经验、熟悉训推框架的技术专家

最低要求

计算机或相关专业背景,4年以上机器学习的系统工程经验,其中至少2年为大模型方向

精通Python/Go等编程语言之一,熟悉CUDA编程,具备优秀的开发调试能力,熟悉Triton、CUTLASS、有算子库开发经验者优先
深入理解多机多卡通信机制与并行策略
熟悉大模型训练/推理相关技术,对训推框架有实际开发和应用落地经验,如Megatron、DeepSpeed、vLLM、TRT-LLM等
对大模型有强烈的好奇心和自驱学习力,具备良好的沟通协作能力

工作职责

负责抖音AI分身数字人的多模态理解&数字人生成算法的训练/推理技术优化,与算法Co-Design提升实时互动模型的效果与性能上限

负责抖音AI分身数字人相关模型的规模部署,支撑Multi Agent/多模态的交互探索和效果迭代,打造下一代直播实时互动能力

AI 洞察

优缺点分析

优点

  • 参与抖音核心业务,技术影响力大,项目前景广阔
  • 字节跳动平台资源丰富,薪资待遇优厚
  • 技术复杂度高,需要同时掌握算法和系统工程知识
  • 业务迭代快,工作强度较大,需要快速响应
  • 多地点办公可能涉及协调沟通成本

缺点 / 挑战

  • 接触大模型最前沿的工程挑战,技术成长迅速
  • 适合有大模型系统工程经验、热爱技术挑战、渴望在AI应用落地中发挥核心作用的工程师

角色解读

  • 成为大模型工程领域的资深专家,主导核心技术方向
  • 向技术管理岗发展,带领团队进行系统架构和优化
  • 深入多模态和数字人前沿,参与行业标准和创新
  • 优化抖音AI分身数字人的多模态理解与生成算法,提升训练和推理效率
  • 与算法团队协同设计,提高实时互动模型的效果和性能上限
  • 负责数字人模型的大规模部署,支撑多Agent和多模态交互探索
  • 打造下一代直播实时互动能力,推动产品迭代
  • 精通Python/Go和CUDA编程,具备高性能计算能力
  • 熟悉大模型训练推理框架如Megatron、DeepSpeed、vLLM、TRT-LLM
  • 理解多机多卡通信机制与并行策略,有算子库开发经验者优先
  • 具备系统工程经验,能够将算法落地到大规模生产环境

申请策略

  • 在简历中明确提及对大模型的好奇心和自驱学习经历,如开源贡献或技术博客
  • 面试前了解抖音AI分身业务背景,思考可能的技术方案
  • 突出大模型训练/推理优化项目经验,尤其是框架二次开发或性能调优
  • 展示GPU编程和并行计算能力,如CUDA算子优化
  • 强调与算法团队协作的经验和成果
  • 列出系统性工程能力,如大规模部署和运维经验
  • 深入学习Triton、CUTLASS等算子库,提升底层优化能力
  • 熟悉多模态模型(如CLIP、Llava)的基本原理和工程实践

面试指南

  • 项目描述采用STAR法则:场景、任务、行动、结果
  • 技术讨论先给出核心原理,再结合实际案例说明选择
  • 遇到开放性问题,先分析约束条件,再分点给出方案
  • 请描述一个你优化大模型训练/推理性能的项目,具体做了哪些工作?
  • 如何设计多机多卡通信策略来提升训练效率?
  • 谈谈你对数字人技术中多模态融合的理解和工程实现难点
  • 如果模型部署需要支持高并发低延迟,你会如何优化?
  • 你对Megatron和DeepSpeed的差异和适用场景有何看法?

匹配度报告

68
综合匹配度

字节大模型工程专家,前沿技术栈,高薪资高成长,但WLB较弱。

适合人群
适合优先看重技能成长和薪资回报,对工作强度有准备的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活30
使命价值65

薪资福利匹配

85较高

字节薪资水平高,福利完善,但未明确提及年终奖等具体福利,薪资信号为未披露,综合评分较好。

薪资信号未披露(AI估算:50K-80K/月)

成长发展匹配

90较高

大模型前沿技术,涉及训推框架和多模态,技能成长空间大,但JD未明确提及晋升通道。

技术前沿前沿/新兴技术
技术栈Megatron、DeepSpeed、vLLM、TRT-LLM、CUDA、Triton、CUTLASS、多模态
业务类型profit_center

工作生活匹配

30较低

仅现场办公,北京/深圳均为一线城市通勤压力大,JD未提及WLB相关,预计工作强度较高。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

65中等

AI直播互动属于高速增长赛道,技术具有创新性,但社会影响力一般。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 产品设计专家(主架构)-PICO

    字节跳动 · 上海市
    AI 估算 · 35k-65k
  • 高级/资深后端开发工程师-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 算法工程师(搜索)-今日头条

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • 客户端安全工程师

    字节跳动 · 广州市
    AI 估算 · 15k-25k
  • 前端开发工程师-计算

    字节跳动 · 北京市
    AI 估算 · 25k-50k

相似职位推荐

  • Java开发实习生-【主站用增方向】

    快手 · 北京市
    AI 估算 · 4k-6k

字节跳动 的其他在招职位

  • 产品设计专家(主架构)-PICO

    字节跳动 · 上海市
    AI 估算 · 35k-65k
  • 高级/资深后端开发工程师-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 算法工程师(搜索)-今日头条

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • 客户端安全工程师

    字节跳动 · 广州市
    AI 估算 · 15k-25k
  • 前端开发工程师-计算

    字节跳动 · 北京市
    AI 估算 · 25k-50k

相似职位推荐

  • Java开发实习生-【主站用增方向】

    快手 · 北京市
    AI 估算 · 4k-6k