Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/混元LLM大模型量化压缩高级算法工程师(北京/深圳/上海)
Tencent logo
T
腾讯 (Tencent)

职位信息

广东省-深圳市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

PyTorchLLM量化算法研究模型压缩推理优化稀疏化
💡

核心评价

腾讯前沿AI算法岗,技术成长性极佳,薪资竞争力强,但需专注现场攻坚。

混元LLM大模型量化压缩高级算法工程师(北京/深圳/上海)

🤖 AI 估测:¥45K-80K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于大语言模型(LLM)性能优化与部署的高级算法工程师职位
你将深入研究并实现模型的量化、稀疏化、投机采样等前沿压缩加速技术,旨在降低模型推理成本并提升速度
工作内容涵盖从算法研究、工具开发到与硬件协同优化的全链路,最终推动高效能大模型在实际业务场景中的落地应用

✓工作职责

深度参与LLM大模型压缩加速方案研究,包括不限于:
投机采样:适配LLM模型架构特性,探索Prefill / RL等场景下优化加速方案
稀疏化:Sparse Attention,KV-Cache压缩,模型结构剪枝等优化技术,协同框架定制化稀疏方案,提升模型推理性能
量化:优化Transformer中 Linear/KV-Cache/Attention量化算法,适配FP8/INT8/NVFP4等量化方案及不同硬件后端
探索极低bit量化训练方案,深度协同硬件联合优化,实现模型体积极致压缩和性能突破,并推动实际业务落地
新技术:聚焦长上下文,多轮对话优化等压缩加速优化技术研究
设计可落地的大模型压缩算法及成本优化方案,助力大模型的性能加速,不限于模型结构/软硬协同优化
分析业务性能瓶颈和模型特点,定制化开发大模型压缩优化工具,实现一站式模型压缩-部署的高速推理方案
参与前沿的模型压缩加速算法研究,追踪领域前沿工作,撰写并发表顶会论文

⭐最低要求

熟悉深度学习算法基本原理,熟练掌握PyTorch,具备扎实的Python编程能力与工程实现能力
熟悉主流LLM模型压缩算法体系,并且了解硬件及推理库上对于模型压缩的支持方案
具有扎实的数理基础,熟悉常见的算法和数据结构,具有良好的编程习惯
了解大模型算法基本原理,熟悉常见LLM大模型

👍优先资格

有顶会论文发表者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公