Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/字节跳动/硬件加速模型编译优化工程师-Data
ByteDance logo
B
字节跳动 (ByteDance)

职位信息

浙江省-杭州市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

PyTorchTensorFlowLLMAI芯片MLIRONNXTVM分布式推理
💡

核心评价

技术前沿大厂核心岗,成长空间极大,薪资竞争力强,WLB信号不明。

硬件加速模型编译优化工程师-Data

🤖 AI 估测:¥35K-70K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

该职位是字节跳动在杭州招聘的硬件加速模型编译优化工程师
你将负责将大模型等AI模型适配到自研芯片上,进行性能评估与软硬件协同优化
核心工作包括优化AI模型的编译框架、构建并调优分布式推理系统,并探索模型量化、稀疏等前沿推理部署技术,旨在实现高性能、高性价比的在线服务

✓工作职责

负责大模型等业务模型在自研芯片进行适配性和性能评估、软硬件协同优化工作
负责AI模型整图或者算子编译框架优化,实现较高硬件利用率和整体性能,提升编译框架的通用性与优化能力
构建分布式推理系统,推理框架极致调优,实现较优的在线部署吞吐和高性价比
模型量化、稀疏、蒸馏等推理部署的探索和落地方案

⭐最低要求

深入理解AI加速硬件的体系结构和并行计算
熟悉深度学习框架和软件栈,熟练使用C/C++、Python等编程语言
熟悉ONNX/TensorFlow/PyTorch等主流深度学习框架
有主动学习、问题分析与解决能力和较强自驱力
具备良好的跨团队协作能力

👍优先资格

熟悉编译器和代码优化技术,有MLIR、TVM等相关开发经验
熟悉GPU或者主流AI芯片架构,有相关算子优化、图编译优化经验、硬件评测经验
对LLM或多模态领域模型有深刻理解,例如Qwen、Deepseek等
有AI加速硬件的量化工具开发经验
熟悉AI服务器和集群架构,熟悉芯片和集群互联相关技术,有实践开发经验
有vLLM、SGLang等推理框架开发和调优经验,有部署实践相关经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI产品经理(海外增长)-飞书

    字节跳动

    北京市 · 仅现场办公

  • 采购政策与合规专家

    字节跳动

    北京市 · 仅现场办公

  • 华南游戏行业销售经理-火山引擎

    字节跳动

    深圳市 · 仅现场办公

  • 高级后台开发工程师-Cross Platform

    字节跳动

    深圳市 · 仅现场办公

  • 前端开发专家/工程师-基础架构(北京)

    字节跳动

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公