Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaohongshu logo
小红书
Agentic AI 端侧推理研究实习生(前端/后端/客户端)
立即应聘

Agentic AI 端侧推理研究实习生(前端/后端/客户端)

发布于 大约 14 小时前

实习/见习

北京市 / 上海市
无经验要求
实习生
仅现场办公
硕士
PyTorch
LLM
模型量化
NPU
MLSys
LoRA
Android NDK
ExecuTorch
Llama.Cpp
Litert

AI 估算 · 6k–12k

AI研究实习生,技术要求高,公司平台大,薪资有竞争力

职位详情

关于这个职位

加入小红书,参与前沿的端侧AI研究!你将横评开源LLM,研究量化与蒸馏技术,设计端云混合路由策略,并构建端侧Agent评测基准

适合对Transformer和LLM推理有深入理解、动手能力强的在读硕士/博士

最低要求

硕士/博士在读,熟悉Transformer架构与LLM推理流程

熟悉PyTorch,了解LiteRT / llama.cpp / ExecuTorch等推理框架至少一种
有模型量化或蒸馏实践经验

工作职责

横评端侧开源LLM(Gemma/Qwen/Phi/Llama),建立准确率×延迟×内存的Pareto基线

研究Tool-Use场景下的量化精度损失与补回方案(GPTQ/AWQ + LoRA微调)
设计端云Hybrid路由策略:哪些意图端侧跑、哪些上云
构建端侧Agent评测Benchmark

优先资格

加分:Android NDK经验 · NPU编程 · MLSys/MobiSys发表

AI 洞察

优缺点分析

  • 前沿技术:直接参与LLM端侧部署和Agent热门方向,技能积累价值高
  • 大厂平台:小红书提供丰富的业务场景和数据资源,成果易落地
  • 学术机会:可发表顶会论文,提升个人学术背景
  • 团队氛围:研究型团队,与优秀同事合作,学习成长快
  • 技术难度高:需同时理解模型、系统和硬件,对综合能力要求高
  • 不确定性大:研究性工作成果周期长,可能面临实验失败
  • 实习竞争激烈:岗位要求高,面试门槛高,需有扎实基础
  • 适合对端侧AI充满热情、喜欢钻研底层技术、有较强动手能力的在读硕博

角色解读

  • 技术专家路线:深耕端侧AI推理优化,成为量化、蒸馏或系统设计专家
  • 学术研究路线:将成果发表至顶会(如MLSys、MobiSys),积累学术影响力
  • 产品落地路线:参与端侧AI功能从研究到产品化的全过程,积累工程经验
  • 横评开源端侧LLM,建立性能基线,分析准确率、延迟和内存占用
  • 研究量化精度损失与补回方案,结合GPTQ/AWQ和LoRA微调
  • 设计端云混合路由策略,优化意图在端侧或云端的执行
  • 构建端侧Agent评测Benchmark,评估模型在真实场景的表现
  • 深入理解Transformer架构和LLM推理流程,熟悉PyTorch
  • 掌握至少一种端侧推理框架,如LiteRT、llama.cpp或ExecuTorch
  • 具备模型量化或蒸馏的实践经验,了解GPTQ/AWQ等工具
  • 加分项:Android NDK、NPU编程、MLSys/MobiSys发表

申请策略

  • 在简历中展示对端侧AI的兴趣,如个人博客或开源贡献
  • 了解小红书的技术博客或产品,提前思考端侧AI在其业务中的应用
  • 突出与LLM、量化、蒸馏相关的项目或论文,详细说明技术方案和成果
  • 强调PyTorch和端侧推理框架的使用经验,展示代码能力(GitHub链接)
  • 如有MLSys/MobiSys发表或Android NDK经验,单独列出
  • 提前熟悉llama.cpp或ExecuTorch,复现简单的量化流程
  • 阅读经典论文(如GPTQ、AWQ、LoRA)并尝试在自己的项目中实现

面试指南

  • 概念解释类:先给出定义,再举例说明,最后对比优缺点
  • 项目经验类:用STAR法则(情境、任务、行动、结果)组织回答
  • 设计题:从问题定义开始,列出约束,提出多种方案,分析取舍,给出推荐
  • 解释Transformer的自注意力机制和LLM推理过程
  • 模型量化的原理和常见方法(PTQ、QAT、GPTQ)的优缺点
  • 如何在端侧设备上部署LLM,考虑延迟、内存和功耗的权衡
  • 描述一个你做过的最复杂的机器学习项目,遇到的技术挑战和解决方案
  • 端云协同场景下,如何决定哪些推理放在端侧?

匹配度报告

65
综合匹配度

前沿端侧AI研究实习,技术成长极佳,但需现场办公且节奏不明。

适合人群
适合以技术成长和学术突破为首要目标的求职者,对生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利60
成长发展90
工作生活40
使命价值70

薪资福利匹配

60中等

实习薪资属于市场中等水平,但福利明确未提及,整体补偿性一般。

薪资信号未披露 (6K-12K/月)

成长发展匹配

90较高

前沿技术方向、研究性强、有发表机会,发展空间极大。

技术前沿前沿/新兴技术
技术栈LLM、PyTorch、LiteRT、llama.cpp、ExecuTorch、GPTQ、AWQ、LoRA
业务类型ambiguous

工作生活匹配

40较低

必须现场办公,未提及弹性工作,且北京上海通勤压力大,生活平衡较差。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI技术发展迅速,端侧智能有社会价值,但JD未强调使命,意义感中等偏上。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • 海外增长运营

    小红书 · 北京市
    AI 估算 · 20k-40k
  • 数据合规实习生

    小红书 · 北京市
    AI 估算 · 4k-6k
  • 账号风控产品实习生

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 行业策略实习生

    小红书 · 上海市
    AI 估算 · 3k-6k
  • 音频引擎算法研发工程师

    小红书 · 北京市
    AI 估算 · 30k-60k

相似职位推荐

  • 算法工程师

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • Dedicated Hybrid Transmission Engineer

    奔驰 · 北京市
    AI 估算 · 20k-35k
  • Agent开发实习生

    美图 · 北京市
    AI 估算 · 6k-9k
  • AI算法总监/负责人

    汽车之家 · 北京市
    AI 估算 · 80k-120k
  • Business R&D Experienced Professional

    日立能源 · 合肥市
    AI 估算 · 18k-28k

小红书 的其他在招职位

  • 海外增长运营

    小红书 · 北京市
    AI 估算 · 20k-40k
  • 数据合规实习生

    小红书 · 北京市
    AI 估算 · 4k-6k
  • 账号风控产品实习生

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 行业策略实习生

    小红书 · 上海市
    AI 估算 · 3k-6k
  • 音频引擎算法研发工程师

    小红书 · 北京市
    AI 估算 · 30k-60k

相似职位推荐

  • 算法工程师

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • Dedicated Hybrid Transmission Engineer

    奔驰 · 北京市
    AI 估算 · 20k-35k
  • Agent开发实习生

    美图 · 北京市
    AI 估算 · 6k-9k
  • AI算法总监/负责人

    汽车之家 · 北京市
    AI 估算 · 80k-120k
  • Business R&D Experienced Professional

    日立能源 · 合肥市
    AI 估算 · 18k-28k