Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/字节跳动/模型系统工程师-抖音推荐
ByteDance logo
B
字节跳动 (ByteDance)

职位信息

北京市
高级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

分布式系统GPU优化系统架构CUDA模型量化vLLM大模型推理TRT-LLMPytorch/Tensorflow
💡

核心评价

大厂核心AI工程岗,技术前沿、成长性极佳、薪资竞争力强,但需接受现场办公及可能的快节奏。

模型系统工程师-抖音推荐

🤖 AI 估测:¥35K-70K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型推理系统架构设计与优化的技术岗位
你将负责提升抖音等核心业务中AI模型的研发和部署效率,通过量化、蒸馏、TRT-LLM等技术极致优化推理性能,并管理GPU资源
你需要与算法团队紧密合作,共同解决大模型应用中的工程挑战

✓工作职责

负责大模型推理系统架构设计及优化,密切配合算法部门,持续优化大模型研发和部署效率
负责跟踪探索多种大模型推理技术,包括量化、蒸馏、TRT-LLM&vLLM、Kernel优化等理论研究和实践开发,极致提升推理性能
负责GPU资源管理和治理,提升GPU资源使用效率

⭐最低要求

本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先
优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI等比赛获奖者优先
掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护
熟悉至少一种主流的机器学习框架(TensorFlow/PyTorch),熟悉CUDA编程和算法的并行化改造,对GPU加速卡有基本了解
熟悉主流大模型结构,具有大模型训练和推理优化经验者优先
熟悉模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、TRT-LLM&vLLM推理优化等,有相关实践经验优化
有强烈的工作责任心,良好的沟通协作能力,对解决具有挑战性问题充满激情,能和团队一起探索新技术,推进技术进步

👍优先资格

有AI工程优化经验的优先
ACM/ICPC、NOI/IOI等比赛获奖者优先
具有大模型训练和推理优化经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI产品经理(海外增长)-飞书

    字节跳动

    北京市 · 仅现场办公

  • 采购政策与合规专家

    字节跳动

    北京市 · 仅现场办公

  • 华南游戏行业销售经理-火山引擎

    字节跳动

    深圳市 · 仅现场办公

  • 高级后台开发工程师-Cross Platform

    字节跳动

    深圳市 · 仅现场办公

  • 前端开发专家/工程师-基础架构(北京)

    字节跳动

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公