小米的顶尖应届-多模态端到端算法工程师-自动驾驶薪资是多少？

该职位薪资范围为 30k–45k（人民币/月）。

顶尖应届-多模态端到端算法工程师-自动驾驶的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

该职位要求硕士学历及无经验要求工作经验。

🤖 AI 估测：¥30K-45K

发布时间：大约 1 个月前

这是一个面向顶尖应届毕业生的多模态端到端算法工程师职位，专注于自动驾驶领域

你将负责研究视觉语言大模型（VLM/VLA）在驾驶场景下的应用，构建从感知到决策的端到端智能体

核心工作包括跨模态表示学习、联合预训练方法探索以及高质量多模态数据集的构建

研究VLM/VLA大模型的跨模态表示机制，构建适用于驾驶语境的latent policy head

探索视觉语言到行为（VL2A）的联合预训练方法，设计引导式数据生成与指令微调机制

构建视觉语言行为多模态数据集，支持高质量对齐（如视觉意图对话、轨迹文字描述）

探索embedding space中的行为压缩、潜变量建模、语言驱动的轨迹解码与规划决策

人工智能、自然语言处理、机器学习、认知科学等相关专业硕士及以上学历

熟悉Transformer-based多模态模型结构，如BLIP-2、Flamingo、BEiT、ViT+LLaMA等

有VLM基础模型finetune经验，对latent policy / latent action建模有深入研究

在顶会发表相关工作，尤其是VLA、latent policy、指令微调领域

有BEV-LLaVA、Drive-GPT、Latent Driver等相关系统研究或实践经验

有构建高质量V+L+A数据集经验（行为图文配对、语言行为对齐）

顶尖应届-多模态端到端算法工程师-自动驾驶

🤖 AI 估测：¥30K-45K

发布时间：大约 1 个月前