小米的高级算法工程师（工业视觉）薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

高级算法工程师（工业视觉）的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求硕士学历及高级经验工作经验。

🤖 AI 估测：¥45K-80K

发布时间：29 天前

这是一个专注于工业视觉质检领域的高级算法工程师职位

你将负责研发和落地多模态大模型，构建能够理解图像、文本和数据的智能质检Agent，并针对工业场景进行模型优化与部署

核心目标是利用前沿AI技术解决传统视觉检测在复杂、小样本场景下的难题，提升工业生产的智能化水平

多模态大模型研发与落地：负责工业视觉质检领域多模态大模型的构建、训练与优化，解决传统CV模型在复杂背景、小样本、零样本缺陷的识别率低的问题

研究并应用多模态融合技术（如图像+文本描述、图像+参数），提升模型对工业缺陷的语义理解与泛化性能，同时实现工业缺陷的自然语言描述生成和智能问答

搭建面向大模型的质检数据生产与清洗的pipeline，包括高质量图文对齐数据的构建、合成数据生成等，并设计模型效果评估体系，驱动算法的持续迭代与优化

针对工业场景的实时性与高精度要求，负责大模型的轻量化部署与推理加速（如量化、剪枝、蒸馏）

质检Agent智能体构建：负责设计并主导研发面向工业视觉质检场景的智能Agent，具备多模态理解能力，能够融合图像、文本（如工艺标准SOP）、传感数据等信息，实现对缺陷的自动化判定、描述、归因及溯源

构建面向质检场景的Agent工作流（Workflow），包括任务规划（模型自动择优等）、节点调用（训练任务的全流程、工具搭建业务流等等）、结果反馈

负责构建并维护质检领域的专业知识库（RAG），结合向量数据库技术，提升Agent在特定缺陷场景下的准确性和可解释性

大模型微调与优化：针对工业质检的小样本、长尾分布问题，设计并实施高效的大模型微调策略（如LoRA、P-Tuning等），提升模型在特定质检任务上的识别检出能力

持续跟进多模态大模型、AIGC、Agent等领域的最新前沿技术进展，并引领团队进行技术预研和创新，探索其在工业缺陷检测中的应用潜力

教育背景与经验：计算机、人工智能、自动化、数学、电子信息等相关专业，硕士及以上学历

5年以上AI算法研发经验，其中至少1-2年专注于大模型（LLM或VLM等）相关领域的研发

工程与编程能力：精通Python编程，熟练掌握PyTorch/TensorFlow/JAX等至少一种主流深度学习框架，能快速复现前沿算法

具备良好的软件工程素养和代码规范

算法能力：熟悉CLIP、SAM、QWEN系列等多模态模型的原理和应用，具备处理图像-文本对齐、视觉问答（VQA）、图像描述生成等任务的实践经验

精通Agent的设计理念和技术栈，有使用LangChain、LlamaIndex或自研框架构建基于知识库的智能Agent（如RAG系统）的完整项目经验

具备丰富的大模型微调（Fine-tuning）实战经验，熟练掌握LoRA、QLoRA等高效微调技术，强化学习算法PPO，GRPO，SAPO等，至少掌握trl，swift一种框架并有成功将模型应用于特定业务的落地案例

综合素质：具备出色的问题分析与解决能力，能够主动发现并攻克技术难题

拥有良好的沟通协作能力和技术领导力，能带领团队完成挑战性任务

行业经验：对工业视觉质检场景有深刻理解，熟悉常见的缺陷类型及检测难点

学术成果：在 CVPR, ICCV, ECCV 等顶级会议发表过相关论文者优先

开源贡献：对知名开源大模型/多模态/Agent项目有重要贡献，或个人GitHub/技术博客在社区有一定影响力者

工程化能力：熟悉大模型部署工具（如vLLM, TensorRT-LLM, ONNX Runtime），有模型服务化（Serving）及边缘端部署经验者优先

高级算法工程师（工业视觉）

🤖 AI 估测：¥45K-80K

发布时间：29 天前