Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/大语言模型算法研究员(架构创新方向)
Kwai logo
K
快手 (Kwai)

职位信息

浙江省-杭州市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

深度学习PyTorch模型架构NeurIPSTensorFlow大语言模型分布式训练MoE线性注意力
💡

核心评价

顶尖大厂前沿架构研究岗,技术成长与行业影响力极强,薪资竞争力高,但工作地点和模式固定。

大语言模型算法研究员(架构创新方向)

🤖 AI 估测:¥45K-80K

发布时间:15 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大语言模型底层架构创新的前沿研究岗位
你将负责设计和实现下一代高效的模型架构,如混合专家(MoE)模型和线性注意力机制,以突破现有Transformer在训练成本、推理效率和长序列处理上的限制
核心目标是推动大模型在长文本理解和生成方面的能力边界,并与工程团队合作确保新架构在大规模场景下的落地

✓工作职责

设计和实现高效稀疏的混合专家(MoE)模型架构,探索稳定训练方法和动态路由机制
改进Transformer架构,通过注意力机制优化等技术显著降低训练推理计算成本
研究基于线性注意力机制的新型架构,突破传统Transformer在长序列处理上的复杂度限制
设计创新的模型结构以增强大模型的长文本理解和生成能力
与工程团队紧密合作,确保新架构在大规模训练和部署中的可行性

⭐最低要求

计算机科学、人工智能、自然语言处理等相关专业硕士及以上学历
在模型架构创新方面有实际研究经验,深入理解Transformer架构及其变体、MoE架构改造、线性注意力等方向
有丰富的研究经验,在顶级会议(如NeurIPS、ICML、ICLR、ACL、EMNLP、NAACL)有一定论文发表
具备扎实的深度学习理论基础和模型优化经验
熟练掌握PyTorch/TensorFlow,了解分布式训练框架(如DeepSpeed、Megatron)
具备强烈的技术热情和创新精神,善于跟踪前沿研究并转化为实际应用
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 履约体验运营-【电商】

    快手

    杭州市 · 仅现场办公

  • 【留用实习】大模型AI Infra底软/硬件加速工程师

    快手

    上海市 · 仅现场办公

  • 大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】策略产品经理-社区治理

    快手

    北京市 · 仅现场办公

  • 【快Star-X】大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公