Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小红书/AI大模型Infra架构工程师 - 创作发布
Xiaohongshu logo
X
小红书 (Xiaohongshu)

职位信息

北京市 / 上海市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

性能优化CUDATensorRTTVMvLLMAI大模型算法工程化推理部署Infra架构
💡

核心评价

技术前沿、成长性极佳、薪资竞争力强的AI大模型Infra核心岗位,WLB信息不明确。

AI大模型Infra架构工程师 - 创作发布

🤖 AI 估测:¥45K-80K

发布时间:28 天前

立即应聘

ℹ️关于这个职位

这是一个专注于AI大模型基础设施的架构工程师岗位,你将负责将前沿的AI算法(如Diffusion、LLM、VLM)在端侧和服务端进行高效部署与性能优化
核心工作包括构建和优化大模型的训练与推理框架,旨在提升用户体验、降低计算成本,并打造业界领先的技术影响力

✓工作职责

负责端侧的AI算法的部署和工程化落地,提升端侧的智能化水平,并通过端侧推理架构的优化,提升用户的使用体验
负责服务端的Diffusion、LLM、VLM、Omini模型等先进算法的部署和极致性能优化,提升推理效率,降低成本
负责Diffusion、VLM等大模型算法训练的框架优化及效率提升,提高算法迭代训练效率,降低成本
打造具有业界一流水平的大模型推理技术能力,并通过开源共建等各类形式,形成在业界的广泛技术影响力

⭐最低要求

对各种AI算法有一定的了解,有丰富的算法工程集成,性能优化和落地经验
熟悉CUDA编程、CUDNN,TensorRT等工具,有丰富的服务端性能优化经验者优先
深入了解NCNN、MNN、TNN、TVM、VLLM框架中的一种或多种,熟悉汇编优化和移动端GPU优化,有多类模型的优化经验者优先
有扎实的编程基础、良好的编程风格和工作习惯,实际动手能力强,具有ACMICPC, NOI/IOI比赛获奖者优先
有良好的沟通表达能力和团队精神,有很好的通过技术解决真实问题创造业务价值的意愿

👍优先资格

熟悉CUDA编程、CUDNN,TensorRT等工具,有丰富的服务端性能优化经验者优先
深入了解NCNN、MNN、TNN、TVM、VLLM框架中的一种或多种,熟悉汇编优化和移动端GPU优化,有多类模型的优化经验者优先
具有ACMICPC, NOI/IOI比赛获奖者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • AI产品运营实习生

    小红书

    上海市 · 仅现场办公

  • 点点AI运营实习生 · AI图像创作

    小红书

    上海市 · 仅现场办公

  • AI Agent算法工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】OLAP研发工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】Ray研发工程师

    小红书

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公