小米的顶尖实习－多模态方向薪资是多少？

该职位薪资范围为 8k–15k（人民币/月）。

顶尖实习－多模态方向的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求本科学历及无经验要求工作经验。

🤖 AI 估测：¥8K-15K

发布时间：29 天前

这是一个小米公司提供的顶尖多模态方向实习岗位

你将深度参与图像/视频理解与生成、3D内容创建、语音/音频处理以及跨模态对齐融合等前沿核心算法的研发与优化工作

该职位要求你具备扎实的科研能力，能独立开展顶会前沿调研，并推动技术在核心项目中的转化与应用

深度参与多模态核心算法与模型的研发工作，覆盖图像/视频理解与生成、3D内容创建、声学信号（语音/音频）处理，以及跨模态（文本-视觉/听觉等）对齐、融合等关键方向

主导部分子任务的设计与落地，参与实验方案制定、数据挖掘与预处理、模型训练及效果验证等全流程科研环节

参与多模态核心算法的设计与优化，针对模型精度、推理速度、显存占用等关键指标开展针对性调优

深入分析实验数据，提炼核心问题并输出创新性优化方案，助力团队突破技术瓶颈，保障核心产品的技术领先性

独立或组队开展多模态、NLP、CV领域顶会（如NeurIPS/ICML/ICCV/ECCV/ACL等）及前沿开源项目的深度调研，聚焦领域核心难点与创新方向

完成高质量调研报告，包含技术原理拆解、性能对比分析及落地可行性评估，推动前沿技术在团队核心项目中的转化与应用

负责核心代码的开发与维护、科研论文的撰写、技术专利的素材整理等工作，主动贡献创新性科研思路

计算机及相关专业（CS/EE/数学/统计/自动化等）在读本硕博，对多模态处理领域有强烈科研热情与明确研究方向

具备扎实的数学基础（线性代数、概率论、优化理论等）与编程能力，精通Python，熟练使用PyTorch/TensorFlow等深度学习框架，有高效代码编写与调试能力

深耕多模态处理、计算机视觉或自然语言处理等相关方向，扎实掌握领域核心理论

具备优秀的科研思维、独立问题解决能力与批判性思维，能快速跟进顶会前沿成果

工作严谨细致，有强烈的求知欲与创新意识，具备良好的团队协作与学术沟通能力

能保证稳定实习时长（建议6个月及以上，每周不少于4天），可尽快到岗

有顶会论文（一作/共同一作优先）、国家级科研项目参与或高质量开源项目核心贡献经历者优先

顶尖实习－多模态方向

🤖 AI 估测：¥8K-15K

发布时间：29 天前