Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
数字人模型工程技术专家-抖音直播(深圳/北京)
立即应聘

数字人模型工程技术专家-抖音直播(深圳/北京)

发布于 大约 9 小时前

普通员工/个人贡献者

深圳市 / 北京市
高级经验
全职员工
仅现场办公
学历未注明
GO
多模态
CUDA
大模型
DeepSpeed
vLLM
TRT-LLM
多机多卡
Megatron
数字人生成

AI 估算 · 40k–80k

头部大厂高级专家岗,技术含量高,薪资竞争力强,结合深圳/北京市场行情及字节薪酬体系估算。

职位详情

关于这个职位

作为抖音AI分身数字人模型工程技术专家,你将负责多模态理解与数字人生成算法的训练/推理优化,与算法团队协同提升实时互动模型效果,并主导模型规模化部署,支撑Multi Agent和多模态交互探索,打造下一代直播互动体验

最低要求

计算机或相关专业背景,4年以上机器学习的系统工程经验,其中至少2年为大模型方向

精通Python/Go等编程语言之一,熟悉CUDA编程,具备优秀的开发调试能力
熟悉大模型训练/推理相关技术,对训推框架有实际开发和应用落地经验,如Megatron、DeepSpeed、vLLM、TRT-LLM等
对大模型有强烈的好奇心和自驱学习力,具备良好的沟通协作能力

工作职责

负责抖音AI分身数字人的多模态理解&数字人生成算法的训练/推理技术优化,与算法Co-Design提升实时互动模型的效果与性能上限

负责抖音AI分身数字人相关模型的规模部署,支撑Multi Agent/多模态的交互探索和效果迭代,打造下一代直播实时互动能力

优先资格

熟悉Triton、CUTLASS、有算子库开发经验者优先

深入理解多机多卡通信机制与并行策略

AI 洞察

优缺点分析

优点

  • 字节跳动技术氛围浓厚,资源丰富,有前沿AI方向探索机会
  • 薪资福利优厚,股票+高年终,职业发展空间大
  • 工作节奏快,可能涉及高强度研发和线上问题响应
  • 技术栈更新频繁,需要持续学习保持竞争力
  • 适合具备多年大模型系统工程经验、热爱技术攻坚、追求技术前沿和快速成长的资深工程师

缺点 / 挑战

  • 抖音直播业务体量大,技术挑战高,能积累顶尖的大模型工程经验
  • 对系统性能要求极高,压力较大

角色解读

  • 技术纵深发展:成为AI工程架构专家,主导核心模型优化
  • 横向拓展:向多模态、Agent系统等前沿方向延伸
  • 管理路线:未来可转向技术团队管理或AI产品架构师
  • 负责AI数字人模型的训练和推理优化,提升性能与效果
  • 与算法团队协同设计,优化实时互动模型
  • 主导模型规模化部署,支持多智能体和多模态交互场景
  • 精通Python/Go和CUDA编程,具备优秀的调试能力
  • 深入掌握大模型训推框架(如Megatron、DeepSpeed、vLLM)
  • 熟悉多机多卡通信与并行策略,有算子库开发经验者优先

申请策略

  • 字节面试注重深度和项目细节,准备时多复盘技术难点和解决方案
  • 关注抖音直播AI技术方向,提前了解其数字人产品布局
  • 突出大模型训推框架的实际落地经验,包括优化效果和数据
  • 强调CUDA编程和并行计算相关项目,体现底层优化能力
  • 展示在直播、实时互动或多模态领域的工程成果
  • 补充Triton/CUTLASS算子开发经验
  • 深入理解多机多卡通信机制(如NVLink、RDMA)
  • 了解最新的大模型推理优化技术(如FlashAttention、PagedAttention)

面试指南

  • 对于项目类问题,采用STAR原则:背景、任务、行动、结果
  • 对于技术方案问题,先分解问题,提出多种方案并比较优劣,给出推荐
  • 对于优化类问题,从数据、算法、系统三个层面分析,并说明权衡
  • 请详细描述你优化过的一个大模型训练/推理项目的技术方案和效果
  • 如何设计一个支持多机多卡的大规模推理服务?
  • CUDA编程中,如何优化算子以减少显存和提升带宽利用率?
  • Megatron和DeepSpeed在并行策略上有什么异同?
  • 如果模型推理延迟不满足线上要求,你会从哪些方面排查和优化?

匹配度报告

71
综合匹配度

头部大厂核心业务,前沿AI技术栈,高薪高成长,但工作强度较大。

适合人群
最适合追求技术成长和高薪酬回报、能接受较高工作强度的资深工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利匹配

85较高

字节跳动薪资水平在行业内极具竞争力,高级专家岗位通常提供高额现金薪酬和股票,福利完善。

薪资信号未披露(AI估算:40K-80K/月)

成长发展匹配

90较高

该职位涉及大模型、多模态等前沿技术,技术挑战大,能快速提升工程和算法能力,字节内部也有丰富的学习资源和晋升通道。

技术前沿前沿/新兴技术
技术栈大模型、多模态、CUDA、并行策略、数字人生成
业务类型profit_center

工作生活匹配

40较低

大厂工程岗位通常工作节奏较快,可能涉及加班和on-call,但字节有弹性工作制,北京/深圳市区办公,通勤便利。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

抖音直播AI数字人技术是直播行业创新方向,能推动互动体验升级,有一定社会影响力,但更多是商业驱动。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 产品设计专家(主架构)-PICO

    字节跳动 · 上海市
    AI 估算 · 35k-65k
  • 高级/资深后端开发工程师-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 算法工程师(搜索)-今日头条

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • 客户端安全工程师

    字节跳动 · 广州市
    AI 估算 · 15k-25k
  • 前端开发工程师-计算

    字节跳动 · 北京市
    AI 估算 · 25k-50k

相似职位推荐

  • Java开发实习生-【主站用增方向】

    快手 · 北京市
    AI 估算 · 4k-6k

字节跳动 的其他在招职位

  • 产品设计专家(主架构)-PICO

    字节跳动 · 上海市
    AI 估算 · 35k-65k
  • 高级/资深后端开发工程师-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 算法工程师(搜索)-今日头条

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • 客户端安全工程师

    字节跳动 · 广州市
    AI 估算 · 15k-25k
  • 前端开发工程师-计算

    字节跳动 · 北京市
    AI 估算 · 25k-50k

相似职位推荐

  • Java开发实习生-【主站用增方向】

    快手 · 北京市
    AI 估算 · 4k-6k