Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Pony AI logo
小马智行
自动驾驶视频理解算法实习生 - 广州
立即应聘

自动驾驶视频理解算法实习生 - 广州

发布于 大约 13 小时前

实习/见习

广州市
无经验要求
实习生
仅现场办公
学历未注明
实习与临时职位
PyTorch
TensorFlow
自动驾驶
数据闭环
视频理解
RNN
多模态大模型
LSTM

AI 估算 · 4k–6k

自动驾驶算法实习岗位,技术前沿但实习薪资通常偏低,根据广州市场实习标准估算。

职位详情

关于这个职位

该职位面向对自动驾驶视频理解感兴趣的实习生,你将参与构建车端视频理解模型的数据闭环,并基于多模态大模型提升模型泛化能力

工作内容涉及前沿的计算机视觉和深度学习技术,适合积累AI算法实践经验

最低要求

了解主流多模态大模型

对RNN/LSTM/Transformer模型有基本的了解
熟悉Pytorch/Tensorflow等训练框架
熟悉Python编程语言
具有良好的沟通合作意识

工作职责

建立自动驾驶车端视频理解模型的数据闭环

基于基座多模态大模型能力,提升车端模型泛化性能

AI 洞察

优缺点分析

优点

  • 接触自动驾驶行业最前沿的视频理解技术,导师经验丰富,学习曲线陡峭
  • 小马智行为行业头部公司,实习经历含金量高,可接触到真实车端数据场景
  • 技术栈全面(多模态、时序模型、PyTorch等),对简历提升显著
  • 数据闭环工作可能较为繁琐,需要耐心和细心处理大量数据问题
  • 实习期间项目周期可能紧张,需具备较强的自我驱动力和问题解决能力
  • 适合对计算机视觉和自动驾驶有浓厚兴趣、具备一定深度学习基础、希望积累实战经验的在校研究生或高年级本科生

缺点 / 挑战

  • 工作内容对算法和编程基础要求较高,需要快速掌握多模态模型原理

角色解读

  • 积累自动驾驶感知领域的实战经验,为后续转正或进入AI大厂打下基础
  • 深入学习多模态大模型前沿技术,未来可向算法工程师、研究科学家方向发展
  • 通过参与数据闭环建设,提升工程化能力和业务理解,利于转型为技术负责人
  • 设计并维护自动驾驶车端视频理解的数据闭环,包括数据采集、标注、训练和迭代
  • 利用多模态大模型(如视觉-语言模型)增强车端模型对复杂场景的泛化能力
  • 编写高效的Python代码,使用PyTorch/TensorFlow训练和优化视频理解模型
  • 熟悉主流多模态大模型架构,如CLIP、BLIP等,了解其训练和微调方法
  • 掌握RNN/LSTM/Transformer等序列模型原理,能应用于视频时序建模
  • 熟练使用PyTorch或TensorFlow进行模型开发,有实际项目经验优先
  • 编程能力强,精通Python,熟悉Linux开发环境

申请策略

  • 在求职信中表达对自动驾驶视频理解方向的热情,以及希望将学术知识应用于工业场景
  • 提前了解小马智行的技术博客或开源项目,在面试中展示对公司的认同
  • 突出多模态大模型相关项目经验,如使用CLIP进行图文匹配或视频理解
  • 强调PyTorch/TensorFlow的使用熟练度,最好附上GitHub代码链接
  • 提及对自动驾驶领域的理解或相关竞赛经历(如nuScenes、Waymo挑战赛)
  • 展示良好的沟通协作能力,例如团队合作的项目或开源贡献
  • 系统学习Vision-Language模型原理,尝试复现CLIP或BLIP等论文
  • 掌握视频时序建模方法,如使用Video Swin Transformer或TimeSformer

面试指南

  • 对于技术类问题,采用STAR法则:先说明任务背景,再解释采取的技术方案,最后总结效果
  • 对于开放性问题,从理论到实践逐步展开,先阐述基本原理,再结合实际场景分析
  • 对于项目类问题,重点突出个人贡献和思考过程,包括遇到的难点及解决思路
  • 请详细解释Transformer在视频理解中的应用原理
  • 如何设计一个数据闭环来解决自动驾驶中的长尾场景?
  • 你曾使用多模态大模型做过什么项目?遇到了哪些挑战?
  • 如果你现在要训练一个视频理解模型,你会如何选择模型架构和训练策略?
  • 你对自动驾驶感知系统有哪些了解?如何看待当前的局限性?

匹配度报告

65
综合匹配度

自动驾驶视频理解算法实习,前沿技术栈,强发展性但薪资较低。

适合人群
最适合追求技术成长和行业前沿、不太在意短期薪资回报的实习生。
最强匹配
成长发展匹配
最弱匹配
薪资福利匹配
薪资福利40
成长发展90
工作生活50
使命价值80

薪资福利匹配

40较低

实习生薪资偏低,且未明确福利,补偿性需求满足度有限。

薪资信号未披露(AI估算:4K-6K/月)

成长发展匹配

90较高

该岗位聚焦自动驾驶前沿技术(多模态大模型、数据闭环),技能成长迅速,发展性需求高度满足。

技术前沿前沿/新兴技术
技术栈多模态大模型、Transformer、PyTorch、视频理解
成长机会数据闭环、泛化性能
业务类型profit_center

工作生活匹配

50较低

要求现场办公,实习时间固定,但未提及加班情况,生活化动机满足一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

80较高

自动驾驶属于高速发展赛道,直接参与智能出行变革,社会影响力正面且富有使命感。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小马智行 的其他在招职位

  • 出海Robotaxi解决方案经理-运营-国外高频出差

    小马智行 · 北京市
    AI 估算 · 25k-40k
  • 多传感器融合3D目标检测实习生 - 广州

    小马智行 · 广州市
    AI 估算 · 4k-8k
  • 大模型算法工程师-广州/北京

    小马智行 · 北京市
    AI 估算 · 30k-60k
  • C++实习生 - 仿真分析与问题复现 - 北京海淀

    小马智行 · 北京市
    AI 估算 · 4k-8k
  • C++实习生 - 性能优化 - 北京海淀

    小马智行 · 北京市
    AI 估算 · 5k-8k

相似职位推荐

  • Intern-Cgt Marketing

    沃特世 · 上海市
    AI 估算 · 4k-6k
  • 创作者运营实习生(舞蹈垂类方向)

    小红书 · 上海市
    AI 估算 · 3k-5k
  • 公关部内容运营实习生

    小红书 · 北京市
    AI 估算 · 4k-6k
  • 实习生-生态产品实习生

    阅文集团 · 上海市
    AI 估算 · 4k-6k
  • 景点玩乐运营实习生(郑州)(MJ035511)

    携程 · 郑州市
    AI 估算 · 2k-4k

小马智行 的其他在招职位

  • 出海Robotaxi解决方案经理-运营-国外高频出差

    小马智行 · 北京市
    AI 估算 · 25k-40k
  • 多传感器融合3D目标检测实习生 - 广州

    小马智行 · 广州市
    AI 估算 · 4k-8k
  • 大模型算法工程师-广州/北京

    小马智行 · 北京市
    AI 估算 · 30k-60k
  • C++实习生 - 仿真分析与问题复现 - 北京海淀

    小马智行 · 北京市
    AI 估算 · 4k-8k
  • C++实习生 - 性能优化 - 北京海淀

    小马智行 · 北京市
    AI 估算 · 5k-8k

相似职位推荐

  • Intern-Cgt Marketing

    沃特世 · 上海市
    AI 估算 · 4k-6k
  • 创作者运营实习生(舞蹈垂类方向)

    小红书 · 上海市
    AI 估算 · 3k-5k
  • 公关部内容运营实习生

    小红书 · 北京市
    AI 估算 · 4k-6k
  • 实习生-生态产品实习生

    阅文集团 · 上海市
    AI 估算 · 4k-6k
  • 景点玩乐运营实习生(郑州)(MJ035511)

    携程 · 郑州市
    AI 估算 · 2k-4k