Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/百度/内容生态研发部_ 推理性能优化工程师(J85683)
Baidu logo
B
百度 (Baidu)

职位信息

北京市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

PyTorchGPU优化CUDA模型推理多模态LLMvLLMTensorRT-LLM
💡

核心评价

百度核心AI工程岗,技术前沿且成长性极佳,薪资竞争力强,但需面对现场办公和可能的技术攻坚强度。

内容生态研发部_ 推理性能优化工程师(J85683)

🤖 AI 估测:¥35K-60K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个专注于AI模型推理性能优化的工程师职位
你将负责优化多模态大语言模型和扩散模型的推理性能,使其达到业界领先水平
工作内容包括GPU集群资源治理、模型服务化以及应对高并发、高可用等技术挑战

✓工作职责

负责内容架构相关开发工作,工作内容包括但不限于:模型推理性能优化、推理卡集群GPU利用率治理、模型服务化、GPU资源调度功能研发等
负责多模态LLM和Diffusion Model的推理性能的极致优化,保持业界SOTA
紧跟多模态LLM、视频生成领域最新研究进展和技术趋势,协同策略团队完成业务落地
和团队一起攻克高性能、高并发、高可用性等各种不同技术场景下的技术挑战

⭐最低要求

熟练掌握Linux环境下的C/C++、Python语言,熟悉docker使用
熟悉深度学习基本原理和Pytorch深度学习框架,有对Pytorch框架二次开发经验者优先
熟悉Transformer模型及其应用场景,熟练掌握至少一种开源社区的大模型推理框架,如vLLM、SGLang、TensorRT-LLM、LightLLM等
熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等,有CUDA开发经验者优先
具备良好的论文阅读分析和文档撰写能力,独立解决问题的能力,良好的团队合作精神

👍优先资格

具备机器学习平台或者大模型推理加速相关研发经验者优先
参与开源分布式推理框架项目开发,并提供相应代码贡献者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • Agent产品经理(J99599)

    百度

    北京市 · 仅现场办公

  • 开发测试工程师(实习生)(J99576)

    百度

    北京市 · 仅现场办公

  • Agent产品经理(J99563)

    百度

    北京市 · 仅现场办公

  • 平台产品经理(J99562)

    百度

    北京市 · 仅现场办公

  • Agent工程架构师(J99561)

    百度

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公