Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Baidu logo
百度
多模态大模型视频理解算法研发工程师(J89977)
立即应聘

多模态大模型视频理解算法研发工程师(J89977)

发布于 大约 2 小时前

普通员工/个人贡献者

北京市 / 上海市
高级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
PyTorch
TensorFlow
LLM
分布式训练
VLM
CLIP
ViT

AI 估算 · 30k–60k

高级算法岗,顶尖大厂,硕博学历要求,对标视频理解前沿,薪资竞争力强。

职位详情

关于这个职位

该职位聚焦于多模态大模型在视频理解方向的前沿算法研发,核心任务包括视频问答、描述生成、时序定位等

你将与顶尖团队合作,从数据构建到分布式训练,推动SOTA模型落地
适合具备深度学习、视频理解或多模态研究背景,热爱技术突破的硕博人才

最低要求

教育背景:计算机科学、人工智能、电子信息、自动化或相关领域的硕士或博士学历

专业经验:具备扎实的机器学习、深度学习理论基础,对Transformer、ViT、CNN、RNN等模型有深入理解
精通Python编程,并熟练掌握至少一种主流深度学习框架
在以下至少一个领域有深入的研究或项目经验:视频理解(如行为识别、视频分类、时序定位等)
多模态学习(熟悉CLIP、ALIGN等多模态预训练模型,了解跨模态融合、对齐等技术)
大语言模型(LLM)/视觉语言模型(VLM),有LLM或VLM的微调、开发经验
科研能力:在CVPR, ICCV, ECCV, NeurIPS, ICLR, AAAI等顶级人工智能会议/期刊上发表过相关论文者优先
工程能力:具备处理大规模数据集的经验,熟悉Linux开发环境和Git等协作工具
综合素质:具备优秀的分析和解决问题的能力,良好的沟通能力和团队合作精神,对前沿技术有强烈的热情和探索欲

工作职责

前沿算法研发:负责多模态大模型在视频理解方向的算法研究与开发,紧跟CVPR, ICCV, NeurIPS等顶会的最新进展,探索和实现世界领先的(SOTA)视频理解模型

核心任务攻关:聚焦于一项或多项核心视频理解任务,包括但不限于:视频问答(Video QA) & 对话
视频描述/摘要生成(Video Captioning/Summarization)
时序行为定位与识别(Temporal Action Localization & Recognition)
视频主题/事件检测(Video Topic/Event Detection)
大规模数据构建:负责视频理解所需的大规模、高质量多模态数据集的构建,包括数据采集、清洗、标注和管理策略的制定与执行
大规模训练:负责视频理解大模型的分布式训练、微调和性能优化,解决训练过程中的效率和收敛性挑战
技术落地与创新:与业务团队紧密合作,推动算法在产品中的实际应用与效果验证,并从中提炼出新的算法迭代方向

AI 洞察

暂无 AI 洞察数据

匹配度报告

Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • 视频生成大模型算法工程师(J96246)

    百度 · 北京市
    AI 估算 · 30k-60k
  • 大模型产品经理(J95988)

    百度 · 北京市
    AI 估算 · 25k-45k
  • 大模型算法工程师(J96229)

    百度 · 深圳市
    AI 估算 · 25k-45k
  • 可控人像视频生成算法工程师(J91590)

    百度 · 北京市
    AI 估算 · 25k-45k
  • 多模态理解与生成数据算法工程师(J91588)

    百度 · 北京市
    AI 估算 · 30k-50k

相似职位推荐

  • 微信读书/输入法/秒剪-大模型数据与评测工程师 -NLP&多模态方向

    腾讯 · 北京市
    AI 估算 · 30k-50k
  • 一段式端到端仿真测试专家_XC

    博世 · 上海市
    AI 估算 · 30k-50k

百度 的其他在招职位

  • 视频生成大模型算法工程师(J96246)

    百度 · 北京市
    AI 估算 · 30k-60k
  • 大模型产品经理(J95988)

    百度 · 北京市
    AI 估算 · 25k-45k
  • 大模型算法工程师(J96229)

    百度 · 深圳市
    AI 估算 · 25k-45k
  • 可控人像视频生成算法工程师(J91590)

    百度 · 北京市
    AI 估算 · 25k-45k
  • 多模态理解与生成数据算法工程师(J91588)

    百度 · 北京市
    AI 估算 · 30k-50k

相似职位推荐

  • 微信读书/输入法/秒剪-大模型数据与评测工程师 -NLP&多模态方向

    腾讯 · 北京市
    AI 估算 · 30k-50k
  • 一段式端到端仿真测试专家_XC

    博世 · 上海市
    AI 估算 · 30k-50k