Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
多媒体算法工程师(AI Infra)-视频与边缘
立即应聘

多媒体算法工程师(AI Infra)-视频与边缘

发布于 1 天前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
本科
PyTorch
CUDA
并行计算
模型推理优化
异构计算
DeepSpeed
SGLang
vLLM
多模态大模型
TensorRT-LLM

AI 估算 · 35k–65k

字节跳动高级算法工程师,上海,硕士为主,音视频/AI方向稀缺,市场薪资约35-65K,15薪。

职位详情

关于这个职位

该职位负责音视频生成与多模态大模型算法的研发与优化,包括模型训练加速、推理优化及工程化落地

你将跟踪前沿技术,开发定制化算法,并与跨团队协作将模型从实验室推向生产
适合具备深度学习框架优化经验、熟悉并行计算和异构计算的技术专家

最低要求

计算机、通信、信号处理等相关专业,本科及以上学历,3年以上算法研发工作经验

精通Python,熟悉PyTorch、FSDP、DeepSpeed、Megatron等训练框架
熟悉CUDA、AscendC、Triton、TileLang等异构语言,具备FlashAttention、Conv2d、Matmul、GroupedMatmul等算子加速经验优先
熟悉主流音视频生成、多模态算法模型原理,具有模型训练适配、模型加速、模型量化、通算融合能力,具备多线程、并行计算开发经验,熟悉TensorRT-LLM、SGLang、vLLM等推理引擎优先

工作职责

负责跟踪音视频生成、多模态大模型的前沿技术与发展动态,依据不同业务场景(如视频风格迁移、智能语音交互、音频内容创作等)开展模型应用的定制化开发,实现多媒体创新功能

负责音视频生成、多模态大模型训练算法的优化工作,分析训练框架的性能瓶颈,改进训练框架及策略,运用数据并行、模型并行、流水线并行、通信优化等手段提升训练效率,最大限度提高硬件资源利用率
负责音视频生成、多模态大模型推理算法的优化工作,从模型架构、推理框架适配、参数调优到并行加速等方面,全面提升模型的运行效率
负责模型的工程化落地,与算法、产品、前端/客户端、后端等团队协同合作,打通模型链路,将音视频生成、多模态大模型从实验室阶段推进至生产部署阶段,确保其在实际业务环境中稳定运行

AI 洞察

优缺点分析

优点

  • 身处AI Infra前沿领域,接触大规模分布式训练和推理优化,技术壁垒高、积累价值大
  • 字节跳动拥有海量业务场景和计算资源,能够深入参与从研究到落地的全链路
  • 音视频生成和多模态大模型是当前风口方向,就业前景广阔,薪资竞争力强
  • 技术复杂度高,需要同时掌握算法、框架、底层硬件知识,学习曲线陡峭
  • 业务节奏快,可能需要应对高压的交付和性能优化目标,工作时间较长
  • 算法迭代迅速,需要持续跟踪最新论文和技术方案,保持技术敏感度
  • 适合热爱底层优化、喜欢钻研系统性能、对音视频/AI Infra有浓厚兴趣的技术工程师,尤其是具有分布式训练或推理优化经验者

缺点 / 挑战

暂无明显挑战项

角色解读

  • 深耕AI Infra领域,逐步成长为训练/推理优化专家,主导下一代框架设计
  • 横向拓展至多模态、音视频生成等算法方向,成为算法与工程兼备的复合型人才
  • 在字节跳动内部,可向技术专家(P序列)或技术管理(M序列)发展,带领团队攻克关键技术难题
  • 跟踪音视频生成和多模态大模型的最新技术动态,针对不同业务场景(如视频风格迁移、智能语音交互)开发定制化算法
  • 优化大规模训练框架,通过数据并行、模型并行、通信优化等手段提升训练效率和硬件利用率
  • 负责推理引擎的适配和调优,使用TensorRT-LLM、vLLM等工具加速模型推理,并推动模型从研究到生产的工程化落地
  • 精通Python和PyTorch,熟悉DeepSpeed、Megatron等分布式训练框架,具备大规模模型训练优化经验
  • 掌握CUDA、Triton等异构编程语言,有FlashAttention、Conv2d等算子加速经验
  • 熟悉主流音视频生成和多模态模型原理,具备模型量化、通算融合和推理优化能力
  • 具备多线程和并行计算开发经验,熟悉TensorRT-LLM、SGLang、vLLM等推理引擎

申请策略

  • 了解字节跳动的业务线(抖音、TikTok、火山引擎等),在面试中展现对音视频场景的理解
  • 提前准备一个完整的模型优化案例,从问题分析到方案选型再到性能数据,展示系统化思维
  • 突出分布式训练和推理优化的项目经验,如使用DeepSpeed/Megatron加速训练、通过TensorRT-LLM加速推理的具体成果
  • 强调算子级优化经历,如FlashAttention、Conv2d的CUDA实现或性能提升数据
  • 展示音视频生成或多模态模型相关的工程落地案例,包括模型量化、推理部署等
  • 若有开源贡献(如提交PR到PyTorch、vLLM等),务必体现
  • 补充AscendC或TileLang等国产异构编程语言经验
  • 深入理解Transformer架构和主流多模态模型(如CLIP、Stable Diffusion)的原理

面试指南

  • 针对优化类问题,采用“问题分析-方案选型-实现细节-效果量化”的STAR框架
  • 对于原理性问题,先概述核心思想,再深入关键机制(如FlashAttention的tiling),最后对比优劣
  • 综合性问题需要从算法、框架、底层硬件多个层面分层回答,体现系统性思维
  • 请描述一次你使用DeepSpeed进行大规模训练优化的经历,遇到了哪些瓶颈,如何解决的?
  • 如何优化Transformer模型的推理速度?请从模型架构、算子、框架层面展开
  • FlashAttention的原理是什么?相比标准Attention在性能和显存上的优势?
  • 多模态大模型(如CLIP)在图文匹配任务中,你会如何优化其训练效率?
  • 请解释数据并行、模型并行、流水线并行的区别及适用场景

匹配度报告

71
综合匹配度

字节跳动前沿AI Infra岗位,薪资优厚、技术成长极佳,但WLB较差。

适合人群
适合高度重视技术成长和薪资回报、能够适应高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利匹配

85较高

字节跳动提供具有竞争力的薪酬(高级算法岗市场水准偏高),福利完善(五险一金、补充医疗、免费三餐等),但薪资面议未明确具体数字,整体补偿性较高。

薪资信号未披露(AI估算:35K-65K/月)

成长发展匹配

90较高

职位涉及音视频生成和多模态大模型等前沿技术,主流现代技术栈(PyTorch、DeepSpeed、CUDA等),提供极佳的技能成长空间,但JD未明确提及晋升通道。

技术前沿前沿/新兴技术
技术栈PyTorch、DeepSpeed、Megatron、CUDA、TensorRT-LLM、SGLang、vLLM、FlashAttention
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及弹性工时或远程,字节跳动工作节奏较快,WLB信号不足,生活环境虽好但通勤可能较长。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

音视频生成和多模态大模型属于AI前沿领域,高速增长赛道,对社会娱乐和内容创作有较大影响,但字节跳动业务导向强,使命感一般。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k
  • PD Chemist

    汉高 · 上海市
    AI 估算 · 18k-28k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k
  • PD Chemist

    汉高 · 上海市
    AI 估算 · 18k-28k