Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小红书/【Ace顶尖实习生】diffusion/Autoregressive范式下的LLM模型极致性能优化和SLO低时延探索
Xiaohongshu logo
X
小红书 (Xiaohongshu)

职位信息

北京市 / 上海市
中级经验
实习生
仅现场办公
本科
实习/见习

标签

分布式系统高性能计算LLMCUDA模型量化TensorRTvLLMFlashattentionAi Infra
💡

核心评价

技术成长性极高的顶尖AI Infra实习,前沿技术栈,平台优势明显,但WLB和稳定性非核心考量。

【Ace顶尖实习生】diffusion/Autoregressive范式下的LLM模型极致性能优化和SLO低时延探索

🤖 AI 估测:¥12K-20K

发布时间:23 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大语言模型(LLM)推理性能优化的顶尖实习生岗位
你将研究 Diffusion 和 Autoregressive 两种范式下的模型,通过 KV Cache 管理、算子融合、并行解码等技术,构建统一的低时延、高吞吐推理框架
目标是解决大模型在线服务中时延与成本难以兼顾的难题,为智能问答、代码生成等服务的规模化部署提供支撑

✓工作职责

本课题聚焦 Diffusion/Autoregressive 范式下 LLM 的极致性能优化与 SLO 低时延推理,面向大模型在线服务中 TTFT、TPOT、P99 时延与吞吐成本 难以兼顾的问题,结合最新 AI Infra SOTA 展开系统研究
自回归模型虽具备成熟生态,但受限于逐 token 串行生成
Diffusion Language Model 则具备并行去噪与迭代 refinement 潜力,有望突破解码瓶颈
课题拟结合 vLLM/PagedAttention、FlashAttention、TensorRT-LLM、Speculative Decoding、Medusa、EAGLE、SGLang 等代表性工作,从 KV Cache 管理、连续批处理、动态调度、算子融合、并行解码、低比特量化与软硬件协同优化 等方向,构建统一的跨范式推理优化框架
研究目标是在保证生成质量前提下,实现满足不同 SLO 的低时延、高吞吐与低成本推理,为大模型在智能问答、代码生成、Agent 与多模态服务中的规模化部署提供理论与工程支撑

⭐最低要求

计算机及相关专业本科以上学历,具备高性能系统或 AI Infra 研发经验
精通 C/C++,具备扎实的系统底层能力(内存、并发、网络),代码风格优雅,热衷技术分享
深入理解至少一种主流训练/推理框架(XDL、TFRA、DeepRec、TorchRec、DeepSpeed、veRL、Megatron 等),对其执行模型与性能瓶颈有源码级洞察
熟悉 TensorFlow Serving、TensorRT、OpenXLA、ONNX Runtime 等推理后端,具备大模型量化、编译优化与线上 A/B 调优实战经验
了解推荐/广告典型模型(DeepFM、DIEN、SIM、OneRec、RankMixer 等),熟悉样本生成→训练→上线→推理→特征服务的完整链路
有 GPU/TPU 集群建设与性能调优经验,熟练使用 CUDA、cuDNN、TensorRT 等工具,能够定位并解决分布式环境中的复杂性能瓶颈

👍优先资格

【加分项】
主导或核心参与过万卡级以上 AI 训练/推理平台的架构设计、实现和升级
在 TensorFlow、PyTorch、DeepSpeed 等社区有持续代码贡献
或有高质量技术博客、顶会论文(OSDI、SOSP、MLSys、KDD、RecSys 等)
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • AI产品运营实习生

    小红书

    上海市 · 仅现场办公

  • 点点AI运营实习生 · AI图像创作

    小红书

    上海市 · 仅现场办公

  • AI Agent算法工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】OLAP研发工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】Ray研发工程师

    小红书

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公