Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型推理优化工程师-抖音
立即应聘

大模型推理优化工程师-抖音

发布于 1 天前

普通员工/个人贡献者

深圳市
中级经验
全职员工
仅现场办公
本科
PyTorch
GPU优化
模型蒸馏
模型量化
模型剪枝
TensorRT
vLLM
diffusion

AI 估算 · 30k–50k

字节跳动大模型岗位,技术要求高,深圳大厂薪资有竞争力,参考市场30-50K/月。

职位详情

关于这个职位

该职位负责抖音AIGC大模型(图像/视频/3D等)的推理加速与工程落地,涉及模型蒸馏、量化、剪枝、异构适配等前沿技术,同时参与训练优化与GPU资源管理

适合有深度学习推理优化经验、热爱挑战的工程师

最低要求

本科学历及以上,人工智能、计算机视觉、计算机图形学、软件工程等相关专业

具有优秀的编程基础,熟练使用C++和Python编程语言以及PyTorch深度学习框架,熟悉GPU/NPU上的算子开发
具有扎实的机器学习/深度学习基础,熟悉常见大模型架构和算子实现细节,特别是对Diffusion和LLM模型架构有深入理解
熟悉大模型蒸馏、量化、剪枝等常用压缩技术,熟练使用常见推理加速工具,如TensorRT、vLLM等
具有优秀的分析和解决问题的能力,对解决具有挑战性的问题充满激情,具备良好的沟通和团队合作能力

工作职责

负责图像/视频/3D/多模态等方向AIGC大模型推理加速研究,包括模型蒸馏、模型量化、模型剪枝、异构卡适配、推理加速框架移植等

负责大模型训练过程中的GPU资源管理、异构卡适配、提升GPU利用率等,以及业务落地过程中大模型的工程服务开发部署
探索前沿推理加速技术,持续提升模型推理效率

优先资格

具有丰富推理优化实践经验者优先

AI 洞察

优缺点分析

优点

  • 涉及前沿技术(AIGC、大模型),持续学习并保持技术领先
  • 薪资待遇优厚,股票期权等福利完善
  • 技术要求高,需要同时掌握算法优化与工程开发,学习曲线陡峭
  • AIGC领域技术迭代快,需持续跟进最新论文与工具

缺点 / 挑战

  • 字节跳动平台,业务规模大,技术落地挑战多,成长空间广阔
  • 业务压力大,可能面临紧迫的交付时间表
  • 适合对深度学习推理优化充满热情、具备扎实工程能力且愿意接受高强度技术挑战的工程师

角色解读

  • 技术纵深发展:成为大模型推理优化领域专家,主导核心算法与工程架构
  • 横向扩展:可转向AIGC模型训练、多模态理解、端侧AI等其他AI方向
  • 管理路径:积累经验后晋升为技术Leader,带领团队攻克难题
  • 负责AIGC大模型的推理加速,包括蒸馏、量化、剪枝等技术研究,提升模型在端侧或服务端的运行效率
  • 参与大模型训练过程的GPU资源调度与利用率优化,确保训练任务高效稳定
  • 将前沿研究成果落地到抖音的实际业务场景中,进行工程化部署与性能调优
  • 精通C++和Python,熟悉PyTorch等框架,具备算子开发能力
  • 扎实的深度学习基础,深入理解Diffusion、LLM等大模型架构与算子细节
  • 掌握TensorRT、vLLM等推理加速工具,有模型压缩(蒸馏/量化/剪枝)实战经验

申请策略

  • 准备1-2个完整的推理优化案例,说明问题、方法、效果
  • 了解字节跳动AIGC产品(如抖音特效、剪映等),面试中展现对业务场景的理解
  • 突出大模型推理加速相关项目经验,如模型量化、蒸馏、剪枝的具体成果
  • 强调C++/Python编程能力和PyTorch、TensorRT等工具的使用深度
  • 展示GPU/NPU算子开发或推理框架移植的实践经验
  • 系统学习vLLM、TensorRT-LLM等主流推理框架的内部原理
  • 复习Diffusion模型与LLM的架构细节,并动手实现简化版本
  • 练习在GPU上进行性能调优(如CUDA编程、NVIDIA Nsight工具)

面试指南

  • 对于技术实现类问题:先说明背景与目标,再分步讲解方法(量化/剪枝等),最后用数据对比展示效果
  • 对于开放性问题:列举几种主流方案,比较优缺点,再结合个人经验阐述选择与权衡
  • 请详细描述你做过的一个模型量化项目,包括量化方法、精度损失和提速效果
  • 解释Diffusion模型在推理时如何加速?你有使用过哪些加速策略?
  • 如何优化大模型在GPU上的内存占用?请给出具体技术方案
  • 谈谈你对vLLM或TensorRT-LLM的理解,它们如何加速LLM推理?
  • 复习深度学习模型加速相关论文(如量化、蒸馏、剪枝的经典工作)
  • 动手复现一个小型推理加速项目,如用TensorRT部署一个简单模型并对比性能

匹配度报告

72
综合匹配度

前沿技术栈、高薪资、高强度,发展性动机极强,但WLB较弱。

适合人群
适合高度重视技术成长和薪资回报、能够接受高强度工作节奏的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活45
使命价值70

薪资福利匹配

85较高

字节跳动作为头部互联网公司,薪资福利具有竞争力,但具体薪资需面议。整体补偿性动机满足度较高。

薪资信号面议 (30K-50K/月)

成长发展匹配

90较高

该职位处于AI前沿领域,技术栈先进,成长空间巨大。但JD未明确提及晋升路径或培训机制。

技术前沿前沿/新兴技术
技术栈大模型、AIGC、Diffusion、LLM、TensorRT、vLLM、模型量化、模型蒸馏、模型剪枝
业务类型ambiguous

工作生活匹配

45较低

字节跳动工作强度普遍较高,JD未提及弹性办公或WLB信息,生活化动机满足度较低。

工作模式未明确
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AIGC是当前热门赛道,对创意产业有变革性影响,但作为商业化产品部门,社会使命感一般。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k