Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Xiaomi logo
小米
音视频生成与编辑算法研究实习生
立即应聘

音视频生成与编辑算法研究实习生

发布于 大约 14 小时前

实习/见习

武汉市
无经验要求
实习生
仅现场办公
硕士
研究与开发 (研发)
深度学习
PyTorch
扩散模型
音频信号处理
视频理解
多模态学习
多模态大模型
数据pipeline
模型评测

AI 估算 · 4k–6k

实习生岗位,小米武汉通常提供有竞争力的实习薪资,结合行业水平估算。

职位详情

关于这个职位

这是一个面向研究型实习生的岗位,你将参与音视频生成与编辑的前沿算法研究与落地,包括模型调研、实验复现和效果优化

你将有机会接触到扩散模型、多模态学习等最新技术,并参与构建高质量数据集和评测体系
适合对音视频AI有浓厚兴趣、具备扎实深度学习基础的硕士研究生

最低要求

计算机、人工智能、电子信息、自动化等相关专业硕士研究生,具备较好的深度学习基础

熟悉 PyTorch 等深度学习框架,具备较强的工程实现能力,能够独立完成模型训练、实验调参、结果分析和代码整理
了解音视频生成、音视频编辑、多模态学习、扩散模型等相关方向之一
有相关论文复现或项目经验者优先
熟悉音频信号处理基础知识
有音频/语音算法经验者优先
对视频理解、视觉表征、多模态大模型有了解者优先
有生成式模型、音视频生成、空间音频等研究经历者优先
具备较好的英文论文阅读能力、实验分析能力和问题拆解能力,能够持续跟踪前沿论文并转化为可验证的实验方案
有钻研精神,责任心强,沟通协作良好

工作职责

参与通用音频生成与编辑、音视频联合编辑相关算法研究与落地

围绕音视频生成与编辑问题,开展模型调研、方案设计、实验复现与效果优化
参与高质量音视频数据集构建与清洗,包括质量筛选、音视频相关性检测、音频/视频 caption、标签体系建设和训练数据 pipeline 优化
建立并完善模型评测体系,围绕音视频质量、语义一致性、编辑可用率等指标进行实验评估和结果分析
输出阶段性研究成果,包括算法代码、模型权重、实验报告、技术方案以及论文/专利等相关材料

AI 洞察

优缺点分析

优点

  • 直接参与前沿音视频生成技术研究,紧跟AI热点方向
  • 小米提供海量数据与计算资源,实验平台优越
  • 团队氛围学术导向,鼓励发表论文和专利,成长迅速
  • 武汉生活成本较低,实习性价比高
  • 音视频生成领域竞争激烈,需要快速跟进最新模型并复现
  • 数据构建和清洗工作可能较为繁琐,需要耐心和细致
  • 适合深度学习基础扎实、对音视频生成有强烈兴趣、具备较强动手能力和钻研精神的硕士研究生

缺点 / 挑战

  • 岗位对学术能力和工程实践要求较高,需要同时兼顾论文阅读和代码实现

角色解读

  • 实习期后可转正为正式算法工程师,继续深入音视频生成领域
  • 未来可发展为高级算法研究员或技术专家,主导AI前沿技术研发
  • 积累多模态和生成式AI经验,向AIGC、自动驾驶感知等方向拓展
  • 参与通用音频生成与编辑、音视频联合编辑算法的研究与落地,包括模型调研、设计、复现与优化
  • 构建高质量音视频数据集,包括质量筛选、caption生成、标签体系建设和数据pipeline优化
  • 建立模型评测体系,围绕音视频质量、语义一致性等指标进行实验评估和结果分析
  • 输出研究成果包括算法代码、实验报告、技术方案及论文/专利等
  • 扎实的深度学习基础,熟练使用PyTorch等框架,能独立完成模型训练和调参
  • 了解音视频生成、扩散模型、多模态学习等相关方向
  • 熟悉音频信号处理基础,有音频/语音算法经验者优先
  • 具备优秀的英文文献阅读能力和实验分析能力

申请策略

  • 申请时附上GitHub链接或论文复现代码会增加竞争力
  • 关注小米AI实验室的研究方向,在面试中展现对音视频生成的理解
  • 突出深度学习相关项目经验,尤其是PyTorch框架下的模型训练和调参经历
  • 如有音视频生成、扩散模型或多模态学习项目,重点描述
  • 强调英语论文阅读能力和独立解决问题的能力
  • 展示任何音频信号处理或语音算法相关经历
  • 提前熟悉扩散模型(如Stable Diffusion、AudioLDM)的原理和代码
  • 补强音频信号处理知识(如FFT、mel-spectrogram、声学特征)

面试指南

  • 技术问题:先明确问题核心,拆解为若干子问题(如数据、模型、评估),再逐一阐述思路
  • 项目经验:采用STAR法则,突出自己独立解决的关键难点和创新点
  • 开放式问题:先展示自己的知识广度,再聚焦到具体方法,体现批判性思维
  • 请详细描述你使用PyTorch完成的一个深度学习项目,包括数据预处理、模型架构和训练过程
  • 扩散模型的基本原理是什么?请简述训练和采样过程
  • 如何评估音视频生成模型的质量?你会选用哪些指标?
  • 你如何看待目前音视频生成领域的挑战和未来趋势?
  • 给定一个音频编辑任务(如语音替换),你会如何设计算法方案?

职位点评

75
综合评分

前沿技术、研究导向、实习薪资一般,发展性极强

更适合这类人
最适合追求技术成长和前沿研究经验的求职者。
表现最好
成长发展
相对薄弱
薪资福利
薪资福利60
成长发展95
工作生活70
使命价值75

薪资福利

60中等

实习生薪资在武汉具有竞争力,但无明确福利保障,补偿性一般。

薪资信号未披露(AI估算:4K-6K/月)

成长发展

95较高

岗位聚焦前沿技术,提供宝贵的研究和工程经验,发展性极强。

技术前沿前沿/新兴技术
技术栈扩散模型、多模态学习、音视频生成、PyTorch、音频信号处理
业务类型ambiguous

工作生活

70中等

现场办公,武汉工作生活平衡尚可,但实习节奏可能偏快。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值

75中等

AI音视频生成属于高速增长赛道,社会影响力中等,创新性强。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • AI 开发工程师(Agent 方向)

    小米 · 武汉市
    AI 估算 · 4k-6k
  • 内容-策略产品实习生-2027届

    小米 · 北京市
    AI 估算 · 3k-5k
  • 小米汽车-硬件工程师-车身工艺

    小米 · 武汉市
    AI 估算 · 20k-35k
  • 商业化产品实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 结构化数据大模型算法实习生-AI实验室

    小米 · 北京市
    AI 估算 · 5k-8k

相似职位推荐

  • AI音频算法工程师-社区技术

    小红书 · 北京市
    AI 估算 · 25k-45k
  • ADAS/AD System Engineering

    大众汽车 · 上海市
    AI 估算 · 20k-35k
  • ADAS/AD Connected Guard

    大众汽车 · 上海市
    AI 估算 · 20k-35k
  • AI大模型算法专家(MJ035554)

    携程 · 上海市
    AI 估算 · 40k-60k
  • AI大模型算法专家(MJ035411)

    携程 · 上海市
    AI 估算 · 40k-70k

小米 的其他在招职位

  • AI 开发工程师(Agent 方向)

    小米 · 武汉市
    AI 估算 · 4k-6k
  • 内容-策略产品实习生-2027届

    小米 · 北京市
    AI 估算 · 3k-5k
  • 小米汽车-硬件工程师-车身工艺

    小米 · 武汉市
    AI 估算 · 20k-35k
  • 商业化产品实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 结构化数据大模型算法实习生-AI实验室

    小米 · 北京市
    AI 估算 · 5k-8k

相似职位推荐

  • AI音频算法工程师-社区技术

    小红书 · 北京市
    AI 估算 · 25k-45k
  • ADAS/AD System Engineering

    大众汽车 · 上海市
    AI 估算 · 20k-35k
  • ADAS/AD Connected Guard

    大众汽车 · 上海市
    AI 估算 · 20k-35k
  • AI大模型算法专家(MJ035554)

    携程 · 上海市
    AI 估算 · 40k-60k
  • AI大模型算法专家(MJ035411)

    携程 · 上海市
    AI 估算 · 40k-70k