Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/智谱/26届校招-推理Infra工程师
GLM logo
G
智谱 (GLM)

职位信息

北京市
无经验要求
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

PyTorch性能优化TensorFlowCUDA模型量化大模型推理分布式推理
💡

核心评价

前沿AI Infra校招岗,技术成长性极佳,处于高速赛道,但WLB信号不明。

26届校招-推理Infra工程师

🤖 AI 估测:¥20K-35K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

这是一个面向2026届毕业生的校招岗位,专注于大模型推理基础设施的研发
你将参与高性能推理框架的设计与开发,负责优化模型推理的性能、稳定性和延迟,并探索前沿的推理加速技术
这是一个能让你深入AI底层系统,接触大模型核心技术的技术岗位

✓工作职责

参与大模型推理框架的设计与开发:协助团队进行支撑大语言模型、图像生成等复杂模型推理的高性能框架研发,推动算法到产品落地的全链路优化,确保推理的高效性、稳定性和低延迟
性能优化与调优:在资深工程师指导下,参与优化内存管理、计算资源分配与调度策略,提升模型推理速度和资源利用率
学习并使用性能分析工具(如Nvidia Nsight)进行瓶颈定位和优化
模型推理加速技术探索:学习并应用业界前沿的推理优化技术,KV Cache优化、模型量化(Quantization)、剪枝(Pruning),跨机分布式推理优化等

⭐最低要求

基础技能:
熟练掌握 C++ 和 Python 编程语言,具备扎实的数据结构、算法和操作系统基础
熟悉至少一种主流的深度学习框架(如 PyTorch、TensorFlow),了解其基本实现原理
了解GPU编程(如 CUDA)或并行计算,有相关的课程项目或实验经验
专业知识:
对 Transformer 架构及主流大模型(如GPT、Llama、Qwen等)的推理特性有基本理解
了解大模型推理的基本流程和常见挑战(如延迟、吞吐、内存占用)

👍优先资格

加分之项(满足以下任一即可):
有大模型推理框架(如 vLLM、TensorRT-LLM、SGLang、llama.cpp等)的使用或初步研究经验
对AI编译器技术(如 TVM、MLIR、Triton)有初步接触或浓厚兴趣
了解大模型推理相关的优化技术,如FlashAttention、PageAttention、量化、LoRA微调等
在相关领域的顶会(MLSys, ASPLOS等)或开源项目中有贡献或论文者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

智谱 的其他在招职位

  • 大模型交付工程师/架构师-北京

    智谱

    北京市 · 仅现场办公

  • 业务拓展实习生

    智谱

    北京市 · 仅现场办公

  • 安卓开发工程师

    智谱

    北京市 · 仅现场办公

  • MaaS-SRE/DBA

    智谱

    北京市 · 仅现场办公

  • 解决方案架构师-深圳

    智谱

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公