Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/稀宇科技/大模型算法工程Co-Design-日常实习
MiniMax logo
M
稀宇科技 (MiniMax)

职位信息

北京市 / 上海市
中级经验
实习生
仅现场办公
本科
实习/见习

标签

系统设计PyTorchCUDA性能调优分布式训练大模型Megatron-LMDeepSpeed
💡

核心评价

前沿AI大模型算法工程实习,技术成长性极高,薪资符合实习生市场水平,工作模式为现场办公。

大模型算法工程Co-Design-日常实习

🤖 AI 估测:¥8K-15K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型算法与系统工程协同设计的实习岗位
你将作为算法研究与工程落地的核心桥梁,负责优化大模型的训练与推理效率、性能与成本,确保前沿算法能在大规模系统中高效实现
工作涉及协同设计、高性能系统实现、分布式架构构建以及前沿技术探索

✓工作职责

协同设计与优化:
深入理解大模型算法(架构、训练/推理技术),评估其工程可行性、性能瓶颈与成本
主导设计下一代训练/推理框架或核心组件,确保原生支持高效算法实现(如高效Attention、通信优化)
系统性解决训练/推理工作负载的性能瓶颈(计算、通信、存储)
高性能系统实现:
设计并实现高性能核心(如定制Kernel)、优化通信与数据流水线
分布式架构:
设计构建大规模分布式训练系统(DeepSpeed/Megatron-LM/FSDP)
设计构建高并发、低延迟的大模型推理服务平台
前瞻探索与协作:
跟踪领域前沿,探索验证新技术(新硬件、非Transformer架构等)
高效沟通,跨团队(算法、工程、平台)协作推动方案落地

⭐最低要求

学历/经验: 计算机/人工智能等相关领域本科及以上,或具备同等杰出实践经验
大模型基础: 深刻理解Transformer架构及大模型训练/推理等相关核心技术
工程硬实力:
精通 PyTorch 及其分布式训练(DDP/FSDP),有大规模分布式系统设计开发调优经验
扎实的计算机体系结构/操作系统/网络基础
丰富的“性能调优”经验(Nsight Systems, Profiler等)

👍优先资格

参与 DeepSpeed/Megatron-LM/vLLM/SGLang 等核心框架开发
GPU Kernel优化 (CUDA/Triton) 经验
千亿参数级模型训练/部署经验
熟悉云平台大规模AI负载管理
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

稀宇科技 的其他在招职位

  • 服务器运维实习生

    稀宇科技

    北京市 · 仅现场办公

  • 智能交互体验设计师(AI产品方向)-实习

    稀宇科技

    上海市 · 仅现场办公

  • 大模型产品经理-实习-Top Talent

    稀宇科技

    北京市 · 仅现场办公

  • 服务器系统实习生

    稀宇科技

    北京市 · 仅现场办公

  • 算法工程研发工程师-2026届

    稀宇科技

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公