Meitu logo
美图
计算机视觉算法-暑期实习生(三维数字人方向)

计算机视觉算法-暑期实习生(三维数字人方向)

发布于 大约 10 小时前

实习/见习

澳大利亚
无经验要求
实习生
混合式弹性办公
博士
实习与临时职位
深度学习
PyTorch
计算机视觉
视频生成
扩散模型
三维重建
Smpl
人体姿态估计

AI 估算 · 8k–15k

博士在读AI实习,三维视觉方向需求高,但实习薪资通常低于全职,估算8000-15000元/月

职位详情

关于这个职位

这是一个面向三维数字人方向的计算机视觉算法暑期实习岗位,你将加入美图的视觉研发团队,参与人物美型、三维重建、时空稳定编辑等前沿算法的研究与落地

工作内容包括2D/3D人像追踪、人体模型回归、多模态信息融合等,有机会产出高质量论文并直接应用于真实产品

最低要求

博士在读,计算机、人工智能、智能艺术等相关专业

熟悉 Python,有常用library应用基础(例如 numpy, transformer, diffuser, open3d等),具备较强的深度学习使用经验(PyTorch)
具备良好的工程实现能力与实验习惯,能够独立完成模块级任务
熟练使用 AI 编程工具,具备良好的代码规范与整理习惯
具备良好的论文阅读、理解分析、概念总结与代码复现能力
逻辑清晰,善于问题拆解,愿意深入理解问题本质
对 AI + 影像 / 三维 / 美学方向有长期兴趣
主动性强,乐于探索新方法并接受挑战
认同以用户体验和技术价值为导向的产品文化

工作职责

参与人物深度估计,多视角生成,2D / 3D 追踪与时空重建相关算法的研究与实现

紧跟三维前沿论文与开源项目,完成实验复现,结合应用需求完成算法适配与改进
协同数据组,完善三维美型开发管线,参与改进数据收集质量评估,达成高质量规模化(high-quality scaling)奠定基础
探索Skeleton/SMPL/Mesh等人体结构先验与深度/法向/光流等多模态信息在人体重建与生成模型中的融合方式
协助构建数据整理、结果评估与效果可视化工具(例如沉浸式视频的美型),支持算法快速迭代
完成三维特征到二维视觉效果的高质量投影与落地,目标A级以上科研论文产出

优先资格

有SMPL / 人体姿态估计 / 3D Reconstruction / Tracking 相关经验

熟悉 视频理解 / 扩散模型 / 自回归 / 流匹配模型 中任一方向
具备科研项目、竞赛或相关开源项目经验
数学或几何直觉较强,具备良好的审美能力,对卓越设计充满热忱

AI 洞察

优缺点分析

优点

  • 接触真实产品级数据和前沿算法,研究与工程结合紧密
  • 有机会产出高质量科研论文,对学术和职业发展帮助大
  • 团队氛围学术化,导师指导充分,适合深度学习
  • 支持远程办公,工作地点灵活
  • 三维视觉领域技术难度大,需要较强的数学和编程基础
  • 适合对三维视觉和人像美型有强烈兴趣、具备扎实深度学习基础、希望兼顾科研与工程实践的博士在读学生

缺点 / 挑战

  • 实习期6个月以上,需要持续投入,对时间要求较高
  • 作为实习生可能需要同时兼顾研究、工程和论文写作,压力较大

角色解读

  • 由实习转正为正式研究员,继续深入三维视觉与AI美型方向
  • 积累顶会论文发表经验,为后续学术或工业界发展奠定基础
  • 可在美图内部转向产品落地或算法架构等更高阶岗位
  • 研究并实现三维人体重建与追踪算法,包括深度估计、多视角生成、时空重建
  • 复现前沿论文并适配到实际产品场景,改进算法效果
  • 探索人体结构先验(如SMPL)与多模态信息(深度、光流)的融合方法
  • 构建数据评估与可视化工具,推动算法快速迭代并产出高水平论文
  • 精通Python和PyTorch,熟悉常见深度学习库(numpy, transformer, diffuser等)
  • 扎实的计算机视觉基础,尤其是三维重建、人体姿态估计相关方向
  • 良好的工程实现能力和实验习惯,能独立完成模块级开发
  • 优秀的论文阅读和代码复现能力,具备问题拆解与逻辑分析能力

申请策略

  • 在求职信中具体说明你对三维数字人方向的理解和兴趣点,最好与美图的产品结合
  • 如果有开源作品或技术博客,请附上链接,展示主动性
  • 突出三维重建、人体姿态估计等相关项目或研究经历,尤其是使用SMPL、PyTorch的经验
  • 列举发表的论文或参与的竞赛,体现科研能力
  • 详细说明工程实现能力,如复现开源项目、搭建完整管线的例子
  • 展示对AI+影像/三维方向的长期兴趣,如相关个人项目或博客
  • 提前熟悉SMPL模型和常见的三维重建开源项目(如NeRF、3D Gaussian Splatting)
  • 补充扩散模型、视频生成等前沿方向的知识

面试指南

  • 项目经验类:按照背景、方法、你的贡献、成果的STAR框架回答,突出技术细节和效果
  • 算法原理类:先给出核心概念,再逐步深入,最后联系实际应用
  • 开放问题类:分点阐述思路,提出多种可能方案并比较优劣
  • 请介绍一下你参与过的三维重建或人体姿态估计项目
  • SMPL模型的基本原理是什么?如何将其应用于人体重建?
  • 如何解决视频中人体追踪的时序一致性问题?
  • 请简述NeRF和3D Gaussian Splatting的区别和适用场景
  • 你如何验证一个三维重建算法的效果?有哪些评价指标?

职位点评

67
综合评分

前沿三维视觉研究型实习,技术成长极高,薪资一般,支持远程。

更适合这类人
最适合追求技术成长和科研突破的求职者,若更看重薪资或稳定性则可能不太匹配。
表现最好
成长发展
相对薄弱
薪资福利
薪资福利50
成长发展88
工作生活70
使命价值60

薪资福利

50较低

实习薪资未明确,通常低于全职,但支持远程可节省通勤成本,整体补偿性一般。

薪资信号未披露(AI估算:8K-15K/月)

成长发展

88较高

岗位接触前沿三维视觉技术,有论文产出机会,成长空间大,发展性动机满足度高。

技术前沿前沿/新兴技术
技术栈三维重建、SMPL、扩散模型、PyTorch、视频生成、人体姿态估计
成长机会科研论文产出、前沿算法
业务类型ambiguous

工作生活

70中等

支持远程办公,工作时间弹性,但需在悉尼时区工作可能有时差,整体灵活性较好。

工作模式混合式弹性办公
办公地点海外(不适用)
加班情况未提及(无法判断)
工作生活平衡支持远程

使命价值

60中等

AI美型领域具有正面社会价值(提升影像体验),但商业导向为主,意义感中等。

行业发展高速增长赛道
社会影响中性/一般
使命信号让艺术与科技美好交汇
创新程度积极采用新技术
Watch Jobs