Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/字节跳动/AI模型训练/推理优化工程师——抖音电商
ByteDance logo
B
字节跳动 (ByteDance)

职位信息

上海市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

LLMCUDA模型量化模型剪枝TensorRT分布式训练推理优化DeepSpeed算子优化
💡

核心评价

字节跳动核心电商业务下的前沿AI优化岗,技术成长性极佳,薪资竞争力强,工作节奏可能较快。

AI模型训练/推理优化工程师——抖音电商

🤖 AI 估测:¥35K-60K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于AI模型训练与推理优化的技术岗位,服务于抖音电商业务
你将负责开发和优化高性能的推理框架,运用量化、剪枝、算子优化等前沿技术加速模型部署,并研究分布式训练等方法来提升模型训练效率

✓工作职责

推理框架开发,适配电商内部自研NLP/CV/MLLM等模型架构,开发针对电商场景的高性能推理框架
2、模型推理加速研究,包括但不限于模型量化蒸馏剪枝,低精度计算,CUDA算子优化,并行计算优化,投机采样,PD分离等加速手段
3、负责模型训练优化算法的研究与开发,运用数据并行、模型并行、通信优化等前沿技术,提升模型训练速度及效率
4、技术输出:定期分享训练和推理优化技术,赋能业务,沉淀专利和论文

⭐最低要求

扎实的机器技术基础,了解前沿的AI技术,有不错的工程实践经验优先
2、熟悉模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、算子优化等
3、了解业界常用的大语言模型推理加速框架,如SGLang,vLLM,TensorRT-LLM等
4、有CUDA开发经验,熟悉TensorRT/Triton/Cutlass经验者优先
5、熟悉LLM模型训练优化,了解混合精度训练、分布式训练等训练加速方法优先
6、有大模型训练优化经验,熟悉FSDP/DeepSpeed/Megatron等分布式训练框架经验者优先
训练/推理优化满足一条即可

👍优先资格

有不错的工程实践经验优先
2、有CUDA开发经验,熟悉TensorRT/Triton/Cutlass经验者优先
3、熟悉LLM模型训练优化,了解混合精度训练、分布式训练等训练加速方法优先
4、有大模型训练优化经验,熟悉FSDP/DeepSpeed/Megatron等分布式训练框架经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI产品经理(海外增长)-飞书

    字节跳动

    北京市 · 仅现场办公

  • 采购政策与合规专家

    字节跳动

    北京市 · 仅现场办公

  • 华南游戏行业销售经理-火山引擎

    字节跳动

    深圳市 · 仅现场办公

  • 高级后台开发工程师-Cross Platform

    字节跳动

    深圳市 · 仅现场办公

  • 前端开发专家/工程师-基础架构(北京)

    字节跳动

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公