百度的2027AIDU-多模态算法工程师(J99956)薪资是多少？

该职位薪资范围为 30k–60k（人民币/月）。

2027AIDU-多模态算法工程师(J99956)的工作地点在哪里？

该职位工作地点位于北京市、上海市。工作形式为仅现场办公。

百度的2027AIDU-多模态算法工程师(J99956)有什么任职要求？

该职位要求硕士学历及专家级经验工作经验。

百度

2027AIDU-多模态算法工程师(J99956)

立即应聘

2027AIDU-多模态算法工程师(J99956)

发布于大约 2 个月前

普通员工/个人贡献者

北京市 / 上海市

专家级经验

全职员工

仅现场办公

硕士

研究与开发 (研发)

深度学习

PyTorch

计算机视觉

扩散模型

模型压缩

多模态大模型

CLIP

PaddlePaddle

跨模态对齐

AI 估算 · 30k–60k

百度AIDU计划面向顶尖人才，多模态算法工程师要求博士或硕士，技术前沿，市场稀缺，月薪参考大厂AI算法岗水平。

职位详情

关于这个职位

该职位是百度2027AIDU计划中的多模态算法工程师，负责多模态大模型的研发与迭代

你将参与图文、视频、语音、3D等多模态融合理解与生成的前沿技术研究，并推动算法在搜索、推荐、AIGC、自动驾驶等核心场景落地

要求具备扎实的计算机视觉和深度学习基础，熟悉扩散模型和多模态大模型，博士或优秀硕士优先

最低要求

博士优先，计算机、模式识别、人工智能、电子工程、数学等相关专业硕士及以上学历

掌握计算机视觉、图像处理、深度学习等基础理论，在多模态模型训练、文档多模态、开放域目标检测、模型压缩小型化等方向有深入研究

熟悉扩散模型、多模态大模型（如CLIP、Flamingo、Qwen-VL等），对图像生成、视频生成、3D生成、数字人等方向有浓厚兴趣及项目经验

熟练掌握Python及PyTorch/PaddlePaddle/TensorFlow等深度学习框架，有较强论文复现能力

具备良好的团队合作精神、沟通能力与问题解决能力，热爱技术，追求创新

工作职责

负责多模态大模型的算法研发与迭代，覆盖图文、视频、语音、3D等多模态融合理解与生成

研究跨模态对齐、对比学习、扩散模型、视频生成、图像编辑、3D生成、风格迁移等前沿技术

参与多模态数据pipeline建设、评测体系设计与业务落地，推动模型在搜索、推荐、AIGC、健康、自动驾驶、网盘文库、视频理解、解题等核心场景中的应用

研发方向包括但不限于：视觉感知算法、多模态理解模型、图像/视频生成、模型压缩轻量化、文档多模态等

建设多模态数据管线，优化模型训练与推理效率，完成算法模型的训练、优化和部署

优先资格

有多模态预训练、蒸馏、视频生成、模型轻量化等经验者优先

在国际顶会（CVPR、ICCV、ECCV、NeurIPS、ICML、AAAI等）或期刊发表过论文，或有开源项目贡献者优先

AI 洞察

优缺点分析

优点

百度作为AI巨头，提供前沿技术平台和海量数据，有利于技术积累和职业成长
多模态是当前AI热门方向，就业前景广阔，技能树含金量高
AIDU计划可能提供有竞争力的薪酬和资源支持
岗位要求高，博士或优秀硕士，且需有顶级会议论文或项目经验，竞争激烈
技术迭代快，需要持续学习跟进最新论文和算法

缺点 / 挑战

互联网大厂工作强度较大，可能需要应对业务压力和交付周期
适合具备顶尖学术背景、对多模态AI有浓厚兴趣、追求技术前沿和挑战的算法人才

角色解读

技术专家路线：在多模态领域深入钻研，成为算法方向的技术带头人
技术管理路线：积累项目经验后，可转向团队管理或技术Leader角色
业务落地路线：深入业务场景，成为AI在搜索、推荐等领域的应用专家
研发多模态大模型算法，包括图文、视频、语音、3D等模态的融合理解和生成
研究跨模态对齐、对比学习、扩散模型等前沿技术，并参与模型训练、优化和部署
建设多模态数据管道和评测体系，推动算法在搜索、推荐、AIGC、自动驾驶等业务场景落地
扎实的计算机视觉和深度学习理论基础，熟悉扩散模型、多模态大模型（如CLIP、Qwen-VL）
熟练掌握Python及PyTorch/PaddlePaddle/TensorFlow框架，具备较强的论文复现和工程实现能力
有相关项目经验或顶会论文发表优先，要求较强的研究创新和团队协作能力

申请策略

了解百度AIDU计划背景，展示对AI技术商业化落地的热情
建议准备针对具体业务场景（如搜索、AIGC）的算法解决方案思路
突出多模态相关项目经验，尤其是扩散模型、视觉生成、跨模态对齐等方向
强调顶会论文发表或开源贡献，展示研究实力
列出熟练掌握的框架（PyTorch等）和复现论文的能力
深入学习最新的多模态大模型论文（如LLaVA、Flamingo等）并尝试复现
加强工程能力，熟悉模型部署和优化工具（如ONNX、TensorRT）

面试指南

对于算法原理问题，建议从背景、核心机制、优缺点和改进方向展开
对于项目经验问题，使用STAR法则（情境、任务、行动、结果）结构化回答
对于开放设计问题，明确问题边界，提出多种方案并比较权衡
请解释CLIP模型的核心思想和损失函数
如何设计一个多模态图文检索系统？
扩散模型在图像生成中的原理是什么？如何加速采样？
你如何评估多模态模型的效果？有哪些评测指标？
请介绍一个你参与的多模态项目，并说明你的贡献和遇到的挑战

职位点评

综合评分

大厂核心AI岗，技术前沿薪资高，但WLB一般，适合追求技术成长和职业回报的顶尖人才。

更适合这类人

该职位最适合发展性动机强的求职者，追求技术前沿、高成长性和职业回报，能接受高强度工作。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展92

工作生活40

使命价值70

薪资福利

85较高

职位薪资竞争力强，百度AIDU通常提供高薪和股票，但JD未明确数字。福利方面未提及具体项，但大厂通常有较完善福利。

薪资信号未披露（AI估算：30K-60K/月）

成长发展

92较高

该职位位于AI前沿技术领域，多模态大模型是当前热点，提供大量学习和成长机会。JD中提到研究多种前沿技术并推动业务落地，有明确的晋升路径（虽未明说）。

技术前沿前沿/新兴技术

技术栈多模态大模型、扩散模型、CLIP、Flamingo、Qwen-VL、跨模态对齐、对比学习、模型压缩

业务类型profit_center

工作生活

40较低

工作地点在北京或上海，仅现场办公，未提及弹性工作或远程选项。大厂算法岗位通常工作强度较大，JD未明确WLB。

工作模式仅现场办公

办公地点科技园/产业园

加班情况未提及（无法判断）

使命价值

70中等

多模态AI具有广泛社会影响，尤其应用于健康、自动驾驶等场景，但JD未明确表达使命感。行业处于高速增长赛道，技术创新性强。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

百度

2027AIDU-多模态算法工程师(J99956)

立即应聘

2027AIDU-多模态算法工程师(J99956)

发布于大约 2 个月前

普通员工/个人贡献者

北京市 / 上海市

专家级经验

全职员工

仅现场办公

硕士

研究与开发 (研发)

深度学习

PyTorch

计算机视觉

扩散模型

模型压缩

多模态大模型

CLIP

PaddlePaddle

跨模态对齐

AI 估算 · 30k–60k

百度AIDU计划面向顶尖人才，多模态算法工程师要求博士或硕士，技术前沿，市场稀缺，月薪参考大厂AI算法岗水平。

职位详情

关于这个职位

该职位是百度2027AIDU计划中的多模态算法工程师，负责多模态大模型的研发与迭代

你将参与图文、视频、语音、3D等多模态融合理解与生成的前沿技术研究，并推动算法在搜索、推荐、AIGC、自动驾驶等核心场景落地

要求具备扎实的计算机视觉和深度学习基础，熟悉扩散模型和多模态大模型，博士或优秀硕士优先

最低要求

博士优先，计算机、模式识别、人工智能、电子工程、数学等相关专业硕士及以上学历

掌握计算机视觉、图像处理、深度学习等基础理论，在多模态模型训练、文档多模态、开放域目标检测、模型压缩小型化等方向有深入研究

熟悉扩散模型、多模态大模型（如CLIP、Flamingo、Qwen-VL等），对图像生成、视频生成、3D生成、数字人等方向有浓厚兴趣及项目经验

熟练掌握Python及PyTorch/PaddlePaddle/TensorFlow等深度学习框架，有较强论文复现能力

具备良好的团队合作精神、沟通能力与问题解决能力，热爱技术，追求创新

工作职责

负责多模态大模型的算法研发与迭代，覆盖图文、视频、语音、3D等多模态融合理解与生成

研究跨模态对齐、对比学习、扩散模型、视频生成、图像编辑、3D生成、风格迁移等前沿技术

研发方向包括但不限于：视觉感知算法、多模态理解模型、图像/视频生成、模型压缩轻量化、文档多模态等

建设多模态数据管线，优化模型训练与推理效率，完成算法模型的训练、优化和部署

优先资格

有多模态预训练、蒸馏、视频生成、模型轻量化等经验者优先

在国际顶会（CVPR、ICCV、ECCV、NeurIPS、ICML、AAAI等）或期刊发表过论文，或有开源项目贡献者优先

AI 洞察

优缺点分析

优点

百度作为AI巨头，提供前沿技术平台和海量数据，有利于技术积累和职业成长
多模态是当前AI热门方向，就业前景广阔，技能树含金量高
AIDU计划可能提供有竞争力的薪酬和资源支持
岗位要求高，博士或优秀硕士，且需有顶级会议论文或项目经验，竞争激烈
技术迭代快，需要持续学习跟进最新论文和算法

缺点 / 挑战

互联网大厂工作强度较大，可能需要应对业务压力和交付周期
适合具备顶尖学术背景、对多模态AI有浓厚兴趣、追求技术前沿和挑战的算法人才

角色解读

技术专家路线：在多模态领域深入钻研，成为算法方向的技术带头人
技术管理路线：积累项目经验后，可转向团队管理或技术Leader角色
业务落地路线：深入业务场景，成为AI在搜索、推荐等领域的应用专家
研发多模态大模型算法，包括图文、视频、语音、3D等模态的融合理解和生成
研究跨模态对齐、对比学习、扩散模型等前沿技术，并参与模型训练、优化和部署
建设多模态数据管道和评测体系，推动算法在搜索、推荐、AIGC、自动驾驶等业务场景落地
扎实的计算机视觉和深度学习理论基础，熟悉扩散模型、多模态大模型（如CLIP、Qwen-VL）
熟练掌握Python及PyTorch/PaddlePaddle/TensorFlow框架，具备较强的论文复现和工程实现能力
有相关项目经验或顶会论文发表优先，要求较强的研究创新和团队协作能力

申请策略

了解百度AIDU计划背景，展示对AI技术商业化落地的热情
建议准备针对具体业务场景（如搜索、AIGC）的算法解决方案思路
突出多模态相关项目经验，尤其是扩散模型、视觉生成、跨模态对齐等方向
强调顶会论文发表或开源贡献，展示研究实力
列出熟练掌握的框架（PyTorch等）和复现论文的能力
深入学习最新的多模态大模型论文（如LLaVA、Flamingo等）并尝试复现
加强工程能力，熟悉模型部署和优化工具（如ONNX、TensorRT）

面试指南

对于算法原理问题，建议从背景、核心机制、优缺点和改进方向展开
对于项目经验问题，使用STAR法则（情境、任务、行动、结果）结构化回答
对于开放设计问题，明确问题边界，提出多种方案并比较权衡
请解释CLIP模型的核心思想和损失函数
如何设计一个多模态图文检索系统？
扩散模型在图像生成中的原理是什么？如何加速采样？
你如何评估多模态模型的效果？有哪些评测指标？
请介绍一个你参与的多模态项目，并说明你的贡献和遇到的挑战

职位点评

综合评分

大厂核心AI岗，技术前沿薪资高，但WLB一般，适合追求技术成长和职业回报的顶尖人才。

更适合这类人

该职位最适合发展性动机强的求职者，追求技术前沿、高成长性和职业回报，能接受高强度工作。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展92

工作生活40

使命价值70

薪资福利

85较高

职位薪资竞争力强，百度AIDU通常提供高薪和股票，但JD未明确数字。福利方面未提及具体项，但大厂通常有较完善福利。

薪资信号未披露（AI估算：30K-60K/月）

成长发展

92较高

技术前沿前沿/新兴技术

技术栈多模态大模型、扩散模型、CLIP、Flamingo、Qwen-VL、跨模态对齐、对比学习、模型压缩

业务类型profit_center

工作生活

40较低

工作地点在北京或上海，仅现场办公，未提及弹性工作或远程选项。大厂算法岗位通常工作强度较大，JD未明确WLB。

工作模式仅现场办公

办公地点科技园/产业园

加班情况未提及（无法判断）

使命价值

70中等

多模态AI具有广泛社会影响，尤其应用于健康、自动驾驶等场景，但JD未明确表达使命感。行业处于高速增长赛道，技术创新性强。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

2027AIDU-多模态算法工程师(J99956)

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

2027AIDU-多模态算法工程师(J99956)

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

百度 的其他在招职位

江苏业务拓展组实习生（J101082）

销售（J101066）

销售管理专家(客户商机管理)（J101178）

海外渠道商业化负责人（J101046）

部门助理（J100569）

相似职位推荐

RMU Engineer

Head of Application Engineering

Process Engineering Automation

Lamination & Gluing Engineer - Process

Coordinator Engineering Electric

百度 的其他在招职位

江苏业务拓展组实习生（J101082）

销售（J101066）

销售管理专家(客户商机管理)（J101178）

海外渠道商业化负责人（J101046）

部门助理（J100569）

相似职位推荐

RMU Engineer

Head of Application Engineering

Process Engineering Automation

Lamination & Gluing Engineer - Process

Coordinator Engineering Electric

百度的其他在招职位

百度的其他在招职位