
百度
2027AIDU-多模态算法工程师(J99956)
2027AIDU-多模态算法工程师(J99956)
发布于 1 天前普通员工/个人贡献者
北京市 / 上海市
专家级经验
全职员工
仅现场办公
硕士
深度学习
PyTorch
计算机视觉
扩散模型
模型压缩
多模态大模型
CLIP
PaddlePaddle
跨模态对齐
AI 估算 · 30k–60k
百度AIDU计划面向顶尖人才,多模态算法工程师要求博士或硕士,技术前沿,市场稀缺,月薪参考大厂AI算法岗水平。
职位详情
关于这个职位
该职位是百度2027AIDU计划中的多模态算法工程师,负责多模态大模型的研发与迭代
你将参与图文、视频、语音、3D等多模态融合理解与生成的前沿技术研究,并推动算法在搜索、推荐、AIGC、自动驾驶等核心场景落地
要求具备扎实的计算机视觉和深度学习基础,熟悉扩散模型和多模态大模型,博士或优秀硕士优先
最低要求
博士优先,计算机、模式识别、人工智能、电子工程、数学等相关专业硕士及以上学历
掌握计算机视觉、图像处理、深度学习等基础理论,在多模态模型训练、文档多模态、开放域目标检测、模型压缩小型化等方向有深入研究
熟悉扩散模型、多模态大模型(如CLIP、Flamingo、Qwen-VL等),对图像生成、视频生成、3D生成、数字人等方向有浓厚兴趣及项目经验
熟练掌握Python及PyTorch/PaddlePaddle/TensorFlow等深度学习框架,有较强论文复现能力
具备良好的团队合作精神、沟通能力与问题解决能力,热爱技术,追求创新
工作职责
负责多模态大模型的算法研发与迭代,覆盖图文、视频、语音、3D等多模态融合理解与生成
研究跨模态对齐、对比学习、扩散模型、视频生成、图像编辑、3D生成、风格迁移等前沿技术
参与多模态数据pipeline建设、评测体系设计与业务落地,推动模型在搜索、推荐、AIGC、健康、自动驾驶、网盘文库、视频理解、解题等核心场景中的应用
研发方向包括但不限于:视觉感知算法、多模态理解模型、图像/视频生成、模型压缩轻量化、文档多模态等
建设多模态数据管线,优化模型训练与推理效率,完成算法模型的训练、优化和部署
优先资格
有多模态预训练、蒸馏、视频生成、模型轻量化等经验者优先
在国际顶会(CVPR、ICCV、ECCV、NeurIPS、ICML、AAAI等)或期刊发表过论文,或有开源项目贡献者优先
AI 洞察
优缺点分析
优点
- 百度作为AI巨头,提供前沿技术平台和海量数据,有利于技术积累和职业成长
- 多模态是当前AI热门方向,就业前景广阔,技能树含金量高
- AIDU计划可能提供有竞争力的薪酬和资源支持
- 岗位要求高,博士或优秀硕士,且需有顶级会议论文或项目经验,竞争激烈
- 技术迭代快,需要持续学习跟进最新论文和算法
缺点 / 挑战
- 互联网大厂工作强度较大,可能需要应对业务压力和交付周期
- 适合具备顶尖学术背景、对多模态AI有浓厚兴趣、追求技术前沿和挑战的算法人才
角色解读
- 技术专家路线:在多模态领域深入钻研,成为算法方向的技术带头人
- 技术管理路线:积累项目经验后,可转向团队管理或技术Leader角色
- 业务落地路线:深入业务场景,成为AI在搜索、推荐等领域的应用专家
- 研发多模态大模型算法,包括图文、视频、语音、3D等模态的融合理解和生成
- 研究跨模态对齐、对比学习、扩散模型等前沿技术,并参与模型训练、优化和部署
- 建设多模态数据管道和评测体系,推动算法在搜索、推荐、AIGC、自动驾驶等业务场景落地
- 扎实的计算机视觉和深度学习理论基础,熟悉扩散模型、多模态大模型(如CLIP、Qwen-VL)
- 熟练掌握Python及PyTorch/PaddlePaddle/TensorFlow框架,具备较强的论文复现和工程实现能力
- 有相关项目经验或顶会论文发表优先,要求较强的研究创新和团队协作能力
申请策略
- 了解百度AIDU计划背景,展示对AI技术商业化落地的热情
- 建议准备针对具体业务场景(如搜索、AIGC)的算法解决方案思路
- 突出多模态相关项目经验,尤其是扩散模型、视觉生成、跨模态对齐等方向
- 强调顶会论文发表或开源贡献,展示研究实力
- 列出熟练掌握的框架(PyTorch等)和复现论文的能力
- 深入学习最新的多模态大模型论文(如LLaVA、Flamingo等)并尝试复现
- 加强工程能力,熟悉模型部署和优化工具(如ONNX、TensorRT)
面试指南
- 对于算法原理问题,建议从背景、核心机制、优缺点和改进方向展开
- 对于项目经验问题,使用STAR法则(情境、任务、行动、结果)结构化回答
- 对于开放设计问题,明确问题边界,提出多种方案并比较权衡
- 请解释CLIP模型的核心思想和损失函数
- 如何设计一个多模态图文检索系统?
- 扩散模型在图像生成中的原理是什么?如何加速采样?
- 你如何评估多模态模型的效果?有哪些评测指标?
- 请介绍一个你参与的多模态项目,并说明你的贡献和遇到的挑战
匹配度报告
72
综合匹配度
大厂核心AI岗,技术前沿薪资高,但WLB一般,适合追求技术成长和职业回报的顶尖人才。
适合人群
该职位最适合发展性动机强的求职者,追求技术前沿、高成长性和职业回报,能接受高强度工作。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展92
工作生活40
使命价值70
薪资福利匹配
85较高
职位薪资竞争力强,百度AIDU通常提供高薪和股票,但JD未明确数字。福利方面未提及具体项,但大厂通常有较完善福利。
薪资信号未披露(AI估算:30K-60K/月)
成长发展匹配
92较高
该职位位于AI前沿技术领域,多模态大模型是当前热点,提供大量学习和成长机会。JD中提到研究多种前沿技术并推动业务落地,有明确的晋升路径(虽未明说)。
技术前沿前沿/新兴技术
技术栈多模态大模型、扩散模型、CLIP、Flamingo、Qwen-VL、跨模态对齐、对比学习、模型压缩
业务类型profit_center
工作生活匹配
40较低
工作地点在北京或上海,仅现场办公,未提及弹性工作或远程选项。大厂算法岗位通常工作强度较大,JD未明确WLB。
工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)
使命价值匹配
70中等
多模态AI具有广泛社会影响,尤其应用于健康、自动驾驶等场景,但JD未明确表达使命感。行业处于高速增长赛道,技术创新性强。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
百度 的其他在招职位
相似职位推荐
Watch Jobs