Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Deepseek logo
深度求索
多模态理解(数据/算法)研究员
立即应聘

多模态理解(数据/算法)研究员

发布于 大约 11 小时前

普通员工/个人贡献者

杭州市 / 北京市
中级经验
全职员工
仅现场办公
学历未注明
研究与开发 (研发)
SFT
数据清洗
数据合成
VLM
多模态学习
RL
OCR
CLIP
评测体系

AI 估算 · 25k–45k

多模态算法研究员属于高需求岗位,杭州/北京薪资较高,B轮中大型公司提供有竞争力的待遇,结合市场水平估算月薪25-45K。

职位详情

关于这个职位

该职位专注于多模态理解基座模型的研发,涵盖视觉编码器优化、多模态预训练与后训练、数据体系构建及评测体系建设

你将挑战多模态领域的本质难题,为AI注入看懂并理解世界的能力,推动AGI关键技术的发展

最低要求

【核心要求】(满足其一即可):

深入理解主流视觉编码器(如 CLIP, SigLIP 等)的模型结构,熟悉其训练与评测方法
熟悉主流多模态模型的架构,具备大规模多模态预训练或后训练(SFT/RL/OPD)实战经验
具备极强的数据直觉,有大规模图文/视频数据清洗、质量标注及数据合成的实战经验
具备一定的工程代码能力
主导和交付过多模态某个垂直领域(包括但不限于 OCR、Image Caption、空间理解、通用 QA、用户意图理解或 Agent 场景)的模型训练与数据迭代
深入研究过多模态模型评测体系建设,不满足于依赖公开榜单,有独立设计人工评测或自动评测流程的经历
即使没有上述特定经验,只要基础特别扎实、代码能力极强、对多模态有极致渴望,我们也欢迎

工作职责

【工作职责】

负责多模态基座模型的迭代
探索视觉编码器和 VLM 的结构、训练策略和评测方式,针对多模态场景持续验证和迭代预训练与后训练(SFT / RL / OPD)算法
负责多模态理解数据体系构建
定义图文/视频数据集的采集方式、质量标准和筛选方法,多部门协作建设大规模自动化清洗、质量筛选与数据合成管线,从数据侧提高模型表现
针对通用问答、文档/图表解析、多模态推理等基础多模态场景,进行针对性的数据收集、模型训练和精细化调优
推动 GUI、白领办公、多模态搜索等场景的多模态 Agent 核心能力建设与落地
搭建面向“用户真实体验”的多维度多模态评测体系
从定义评测维度、收集真实数据、数据标注到模型反馈,定位模型短板,指引模型迭代

优先资格

【加分项】

有行业影响力的高引论文或知名项目贡献
对模型自身真实能力的提升有极致追求,反感且不愿意通过“刷榜”来换取指标的虚假繁荣
对多模态模型的技术发展趋势和应用场景有深刻洞察

AI 洞察

优缺点分析

优点

  • 切入多模态 AGI 核心赛道,技术前沿性强,积累稀缺的基座模型研发经验
  • 公司深耕大模型领域,B 轮阶段具备成长潜力,有机会参与从 0 到 1 的突破
  • 团队使命明确,注重真实能力而非刷榜,工作成就感高
  • 涉及数据、模型、评测全链路,技能树全面,职业壁垒高
  • 多模态研究仍处于早期,技术不确定性高,需要大量探索和试错
  • 对综合能力要求极高,既需深厚算法功底,又需强大工程和数据能力

缺点 / 挑战

  • 工作强度较大,可能面临项目迭代快、竞争激烈的压力
  • 适合对多模态和 AGI 有强烈热情、具备扎实算法与工程基础、追求技术极致且不惧挑战的研究型人才

角色解读

  • 从研究员成长为多模态方向的技术专家或团队负责人,主导基座模型的核心创新
  • 向 AGI 全栈方向拓展,涉及视觉、语言、语音等多模态融合,成为跨领域领军人才
  • 晋升为高级研究员或首席科学家,引领多模态技术发展方向并推动产业化落地
  • 设计并优化视觉编码器和 VLM 模型,探索底层架构与大规模训练策略,持续迭代预训练和后训练算法
  • 构建大规模多模态数据清洗、筛选与合成管线,定义数据集标准,从数据侧提升模型性能
  • 针对通用问答、文档解析、多模态推理等场景进行模型调优,并推动多模态 Agent 核心能力的落地
  • 搭建多维度评测体系,从真实用户反馈出发定位模型短板,指导模型迭代方向
  • 深入理解 CLIP、SigLIP 等视觉编码器架构,熟悉其训练和评测方法
  • 具备大规模多模态预训练或后训练(SFT/RL/OPD)实战经验,熟悉主流多模态模型
  • 强大的数据直觉和工程能力,能处理海量图文/视频数据清洗与合成
  • 在 OCR、Image Caption、空间理解等垂直领域有模型训练与迭代经验

申请策略

  • 提前了解 DeepSeek 的技术路线和已有成果,在面试中展示对其模型的分析与改进思路
  • 准备一个多模态领域的技术洞察演讲,体现对趋势的深刻理解
  • 突出多模态相关项目经验,尤其是视觉编码器优化、大规模预训练/后训练的实战成果
  • 量化数据清洗或合成管线带来的性能提升,展示数据直觉和工程能力
  • 如有高引论文或开源贡献,务必凸显,体现行业影响力
  • 强调对模型真实能力的追求,避免虚假指标,体现与团队价值观匹配
  • 若无直接多模态经验,可先复现 CLIP、VLM 等开源模型,撰写技术博客
  • 补充大规模数据处理技能,学习 Spark、Ray 等分布式框架

面试指南

  • 对于模型架构类问题,从设计动机、核心机制、训练细节、优缺点和适用场景逐步展开
  • 对于项目经验类问题,采用 STAR 法则:情境、任务、行动、结果,突出你的贡献和量化效果
  • 对于开放性问题,先给出明确的观点,再分论点论述,最后总结并提出未来方向
  • 请详细解释 CLIP 和 SigLIP 的异同,以及它们在多模态模型中的作用
  • 如何设计一个大规模多模态数据清洗和合成管线?请举例说明
  • 你在多模态预训练或后训练项目中遇到的最大挑战是什么?如何解决的?
  • 你认为当前多模态评测体系存在哪些问题?如何设计更有效的评测?
  • 对多模态 Agent 场景(如 GUI 操作)有什么技术构想?

职位点评

72
综合评分

前沿多模态研发岗,技术成长性极强,薪资竞争力高,但工作强度大、WLB一般。

更适合这类人
最适合追逐前沿技术、渴望在 AGI 领域做出突破性贡献的求职者,愿意在技术成长上投入时间,对工作生活平衡要求不高。
表现最好
成长发展
相对薄弱
工作生活
薪资福利70
成长发展95
工作生活40
使命价值85

薪资福利

70中等

薪资未明确,但结合公司融资阶段和岗位稀缺性,预计有竞争力,福利未提及。

薪资信号未披露(AI估算:25K-45K/月)

成长发展

95较高

岗位处于多模态前沿,技术挑战大,团队注重真实能力提升,有极强的发展性。

技术前沿前沿/新兴技术
技术栈CLIP、SigLIP、VLM、SFT、RL、OPD、数据合成、评测体系、Agent
成长机会极致追求、极致渴望
业务类型profit_center

工作生活

40较低

仅现场办公,地点在杭州/北京,未提及弹性工作制,可能工作强度较高。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

85较高

AGI 多模态方向社会影响力高,团队使命明确,追求技术真实进步。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号迈向 AGI 的关键一环、让模型拥有理解物理世界的能力、解决现实挑战的核心生产力
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

深度求索 的其他在招职位

  • IT 基础设施团队

    深度求索 · 杭州市
    AI 估算 · 20k-45k
  • Frontier(持续学习/自进化/新范式)研究员

    深度求索 · 北京市
    AI 估算 · 30k-60k
  • HR团队

    深度求索 · 杭州市
    AI 估算 · 15k-30k
  • 法务团队

    深度求索 · 杭州市
    AI 估算 · 12k-25k
  • 后训练(数据/算法)研究员

    深度求索 · 杭州市
    AI 估算 · 30k-60k

相似职位推荐

  • 小米汽车-上车体布置集成工程师

    小米 · 南京市
    AI 估算 · 15k-25k
  • 《王者荣耀》游戏AI Bot算法研究员

    腾讯 · 成都市
    AI 估算 · 25k-45k
  • 算法工程师(医疗服务AI产品)

    中国平安 · 深圳市
    AI 估算 · 25k-40k
  • Verification Engineer

    飞利浦 · 沈阳市
    AI 估算 · 20k-30k
  • Applied Research Intern, Robotics - 2026

    英伟达 · 上海市
    AI 估算 · 6k-10k

深度求索 的其他在招职位

  • IT 基础设施团队

    深度求索 · 杭州市
    AI 估算 · 20k-45k
  • Frontier(持续学习/自进化/新范式)研究员

    深度求索 · 北京市
    AI 估算 · 30k-60k
  • HR团队

    深度求索 · 杭州市
    AI 估算 · 15k-30k
  • 法务团队

    深度求索 · 杭州市
    AI 估算 · 12k-25k
  • 后训练(数据/算法)研究员

    深度求索 · 杭州市
    AI 估算 · 30k-60k

相似职位推荐

  • 小米汽车-上车体布置集成工程师

    小米 · 南京市
    AI 估算 · 15k-25k
  • 《王者荣耀》游戏AI Bot算法研究员

    腾讯 · 成都市
    AI 估算 · 25k-45k
  • 算法工程师(医疗服务AI产品)

    中国平安 · 深圳市
    AI 估算 · 25k-40k
  • Verification Engineer

    飞利浦 · 沈阳市
    AI 估算 · 20k-30k
  • Applied Research Intern, Robotics - 2026

    英伟达 · 上海市
    AI 估算 · 6k-10k