中国电信的计算机视觉与多模态大模型算法实习生薪资是多少？

该职位薪资范围为 6k–10k（人民币/月）。

计算机视觉与多模态大模型算法实习生的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

中国电信的计算机视觉与多模态大模型算法实习生有什么任职要求？

该职位要求硕士学历及无经验要求工作经验。

中国电信

计算机视觉与多模态大模型算法实习生

立即应聘

计算机视觉与多模态大模型算法实习生

发布于大约 2 个月前

实习/见习

北京市

无经验要求

实习生

仅现场办公

硕士

研究与开发 (研发)

深度学习

强化学习

RAG

计算机视觉

多模态

大模型

Llava

AI 估算 · 6k–10k

硕士实习生，大厂平台，前沿技术栈，薪资有竞争力。

职位详情

关于这个职位

这是一个在中国电信北京举办的计算机视觉与多模态大模型算法实习生职位

你将参与到前沿的多模态大模型研发中，包括模型设计、优化、微调和应用落地，涉及视频解析、事件检索、智能助手等方向

适合具备扎实编程和深度学习基础，对多模态AI有浓厚兴趣的硕士生

最低要求

硕士及以上学历，数学、计算机、电子、自动化等相关专业

熟悉C++或Python，具有较强的代码开发能力，熟练在Linux下工作，熟悉Shell

熟悉深度学习算法如CNN、RNN、Transformer等，熟悉TensorFlow，Pytorch等其中一种深度学习框架

熟悉计算机视觉、图像处理等专业领域的学科知识

工作职责

负责多模态大模型的研发和应用，探索超大规模模型，进行系统优化, 参与数据建设、指令微调、偏好对齐、模型优化、原型系统搭建、大模型应用构建

参与多模态大模型的结构设计、模型优化、强化学习后训练等

研究相关技术在智能助手、智能硬件等领域的全新应用和解决方案，包括而不限于全模态理解生成，视觉Agent等能力

结合电信业务和开源技术，对大模型的特定能力进行针对性优化, 在相关应用落地，包括视频解析布控系统、事件检索系统、智能助手、智能硬件等

优先资格

熟悉LLaVA等多模态大模型的框架、预训练和微调等技术，有 MLLM、LLM、RAG、UI Agent方向的实际落地经验优先

在国际会议或期刊（包括但不限于CVPR, ICCV, ECCV, NeurIPS, ICML, AAAI,TPAMI,IJCV, TIP等）上发表过论文者优先

每周出勤至少能够保证3天，可连续实习3个月以上者优先

AI 洞察

优缺点分析

优点

大平台：中国电信作为央企巨头，提供稳定的实习环境和丰富资源
前沿技术：接触多模态大模型、强化学习等热门方向，技术成长快
业务结合：有机会将AI技术落地到真实电信场景，锻炼实战能力
论文支持：优先资质提及论文发表，团队可能支持学术产出
技术门槛高：需要深度学习和多模态领域的扎实基础，学习曲线陡峭
实习期要求：需保证至少3个月每周3天，可能影响课业安排
大厂流程：可能涉及较多文档和审批，创新速度不如初创公司
适合对多模态AI有浓厚兴趣、具备较强编程和深度学习背景，并希望在大型平台积累经验的硕士研究生

缺点 / 挑战

暂无明显挑战项

角色解读

在实习中积累多模态大模型经验，未来可成为算法工程师或研究员
深入AI前沿领域，有机会成为多模态方向的专家，发表高水平论文
依托电信平台，可向AI产品经理或技术管理方向发展
研发多模态大模型，进行预训练、指令微调、偏好对齐和模型优化
参与模型结构设计和系统优化，探索强化学习后训练
研究技术在智能助手、智能硬件等领域的应用，包括视觉Agent
结合电信业务，将大模型落地到视频解析、事件检索等实际系统
扎实的编程能力，熟练使用C++或Python及Linux/Shell
熟悉深度学习框架（TensorFlow/PyTorch）和常见算法（CNN/RNN/Transformer）
掌握计算机视觉和图像处理知识，了解多模态大模型框架（如LLaVA）
有相关项目或论文经验者优先，尤其是MLLM、RAG、Agent方向

申请策略

提前了解中国电信在AI领域的布局（如天翼云、智慧家庭），面试中展现业务理解
准备一个完整的项目案例，用STAR法则说明你的贡献和结果
突出相关项目或论文，尤其是多模态、大模型、计算机视觉方向
强调编程能力：详细列出C++/Python项目经验，展示代码质量
体现对深度学习框架的熟练度，如PyTorch项目
若有开源贡献或竞赛成绩，务必提及
深入学习LLaVA、LLM等开源框架，尝试复现或微调
提升Python/PyTorch编程能力，熟悉分布式训练工具

面试指南

技术类问题：先给出定义，再举例说明，最后联系自身项目
项目经验问题：使用STAR（情境、任务、行动、结果）结构，突出技术细节和量化成果
开放性问题：展示学习能力和研究热情，如提到最新论文或开源项目
请介绍一下多模态大模型的基本结构（如LLaVA的工作原理）
你如何对一个大模型进行指令微调？请描述关键步骤
你在深度学习项目中遇到过哪些挑战？如何解决的？
解释一下Transformer中的注意力机制，为什么它有效？
你对强化学习后训练了解多少？如何应用于大模型？

职位点评

综合评分

大厂实习，前沿多模态技术栈，技术成长空间大，但薪资未明确且WLB一般。

更适合这类人

最适合追求技术成长、希望在多模态大模型领域积累前沿经验的求职者，对薪资福利要求不高者更佳。

表现最好

成长发展

相对薄弱

薪资福利

薪资福利65

成长发展92

工作生活70

使命价值75

薪资福利

65中等

薪资未明确披露，但作为实习岗，通常提供市场水准的补贴，福利未在JD中提及，整体补偿性一般。

薪资信号面议 (6K-10K/月)

成长发展

92较高

职位涉及多模态大模型等前沿技术，明确指出参与模型设计、优化和落地，技术成长空间大。

技术前沿前沿/新兴技术

技术栈计算机视觉、多模态、大模型、深度学习、强化学习、LLaVA、RAG、Agent

业务类型profit_center

工作生活

70中等

要求每周至少3天现场办公，未提弹性工作，但实习期相对灵活，WLB一般。

工作模式仅现场办公

办公地点科技园/产业园

加班情况未提及（无法判断）

使命价值

75中等

在大型央企参与AI前沿技术开发，对视频监控、智能助手等社会应用有一定意义，但使命导向不强。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

中国电信

计算机视觉与多模态大模型算法实习生

立即应聘

计算机视觉与多模态大模型算法实习生

发布于大约 2 个月前

实习/见习

北京市

无经验要求

实习生

仅现场办公

硕士

研究与开发 (研发)

深度学习

强化学习

RAG

计算机视觉

多模态

大模型

Llava

AI 估算 · 6k–10k

硕士实习生，大厂平台，前沿技术栈，薪资有竞争力。

职位详情

关于这个职位

这是一个在中国电信北京举办的计算机视觉与多模态大模型算法实习生职位

你将参与到前沿的多模态大模型研发中，包括模型设计、优化、微调和应用落地，涉及视频解析、事件检索、智能助手等方向

适合具备扎实编程和深度学习基础，对多模态AI有浓厚兴趣的硕士生

最低要求

硕士及以上学历，数学、计算机、电子、自动化等相关专业

熟悉C++或Python，具有较强的代码开发能力，熟练在Linux下工作，熟悉Shell

熟悉深度学习算法如CNN、RNN、Transformer等，熟悉TensorFlow，Pytorch等其中一种深度学习框架

熟悉计算机视觉、图像处理等专业领域的学科知识

工作职责

负责多模态大模型的研发和应用，探索超大规模模型，进行系统优化, 参与数据建设、指令微调、偏好对齐、模型优化、原型系统搭建、大模型应用构建

参与多模态大模型的结构设计、模型优化、强化学习后训练等

研究相关技术在智能助手、智能硬件等领域的全新应用和解决方案，包括而不限于全模态理解生成，视觉Agent等能力

结合电信业务和开源技术，对大模型的特定能力进行针对性优化, 在相关应用落地，包括视频解析布控系统、事件检索系统、智能助手、智能硬件等

优先资格

熟悉LLaVA等多模态大模型的框架、预训练和微调等技术，有 MLLM、LLM、RAG、UI Agent方向的实际落地经验优先

在国际会议或期刊（包括但不限于CVPR, ICCV, ECCV, NeurIPS, ICML, AAAI,TPAMI,IJCV, TIP等）上发表过论文者优先

每周出勤至少能够保证3天，可连续实习3个月以上者优先

AI 洞察

优缺点分析

优点

大平台：中国电信作为央企巨头，提供稳定的实习环境和丰富资源
前沿技术：接触多模态大模型、强化学习等热门方向，技术成长快
业务结合：有机会将AI技术落地到真实电信场景，锻炼实战能力
论文支持：优先资质提及论文发表，团队可能支持学术产出
技术门槛高：需要深度学习和多模态领域的扎实基础，学习曲线陡峭
实习期要求：需保证至少3个月每周3天，可能影响课业安排
大厂流程：可能涉及较多文档和审批，创新速度不如初创公司
适合对多模态AI有浓厚兴趣、具备较强编程和深度学习背景，并希望在大型平台积累经验的硕士研究生

缺点 / 挑战

暂无明显挑战项

角色解读

在实习中积累多模态大模型经验，未来可成为算法工程师或研究员
深入AI前沿领域，有机会成为多模态方向的专家，发表高水平论文
依托电信平台，可向AI产品经理或技术管理方向发展
研发多模态大模型，进行预训练、指令微调、偏好对齐和模型优化
参与模型结构设计和系统优化，探索强化学习后训练
研究技术在智能助手、智能硬件等领域的应用，包括视觉Agent
结合电信业务，将大模型落地到视频解析、事件检索等实际系统
扎实的编程能力，熟练使用C++或Python及Linux/Shell
熟悉深度学习框架（TensorFlow/PyTorch）和常见算法（CNN/RNN/Transformer）
掌握计算机视觉和图像处理知识，了解多模态大模型框架（如LLaVA）
有相关项目或论文经验者优先，尤其是MLLM、RAG、Agent方向

申请策略

提前了解中国电信在AI领域的布局（如天翼云、智慧家庭），面试中展现业务理解
准备一个完整的项目案例，用STAR法则说明你的贡献和结果
突出相关项目或论文，尤其是多模态、大模型、计算机视觉方向
强调编程能力：详细列出C++/Python项目经验，展示代码质量
体现对深度学习框架的熟练度，如PyTorch项目
若有开源贡献或竞赛成绩，务必提及
深入学习LLaVA、LLM等开源框架，尝试复现或微调
提升Python/PyTorch编程能力，熟悉分布式训练工具

面试指南

技术类问题：先给出定义，再举例说明，最后联系自身项目
项目经验问题：使用STAR（情境、任务、行动、结果）结构，突出技术细节和量化成果
开放性问题：展示学习能力和研究热情，如提到最新论文或开源项目
请介绍一下多模态大模型的基本结构（如LLaVA的工作原理）
你如何对一个大模型进行指令微调？请描述关键步骤
你在深度学习项目中遇到过哪些挑战？如何解决的？
解释一下Transformer中的注意力机制，为什么它有效？
你对强化学习后训练了解多少？如何应用于大模型？

职位点评

综合评分

大厂实习，前沿多模态技术栈，技术成长空间大，但薪资未明确且WLB一般。

更适合这类人

最适合追求技术成长、希望在多模态大模型领域积累前沿经验的求职者，对薪资福利要求不高者更佳。

表现最好

成长发展

相对薄弱

薪资福利

薪资福利65

成长发展92

工作生活70

使命价值75

薪资福利

65中等

薪资未明确披露，但作为实习岗，通常提供市场水准的补贴，福利未在JD中提及，整体补偿性一般。

薪资信号面议 (6K-10K/月)

成长发展

92较高

职位涉及多模态大模型等前沿技术，明确指出参与模型设计、优化和落地，技术成长空间大。

技术前沿前沿/新兴技术

技术栈计算机视觉、多模态、大模型、深度学习、强化学习、LLaVA、RAG、Agent

业务类型profit_center

工作生活

70中等

要求每周至少3天现场办公，未提弹性工作，但实习期相对灵活，WLB一般。

工作模式仅现场办公

办公地点科技园/产业园

加班情况未提及（无法判断）

使命价值

75中等

在大型央企参与AI前沿技术开发，对视频监控、智能助手等社会应用有一定意义，但使命导向不强。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

计算机视觉与多模态大模型算法实习生

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

计算机视觉与多模态大模型算法实习生

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

中国电信 的其他在招职位

项目经理

解决方案经理

项目助理 (Project Assistant)-中国通信服务香港公司

人力资源专员

解决方案经理

相似职位推荐

智能控制算法实习生

小米汽车-被动安全试验专家

电气性能开发工程师

音频算法DSP资深工程师7444

音频算法（DSP）专家7446

中国电信 的其他在招职位

项目经理

解决方案经理

项目助理 (Project Assistant)-中国通信服务香港公司

人力资源专员

解决方案经理

相似职位推荐

智能控制算法实习生

小米汽车-被动安全试验专家

电气性能开发工程师

音频算法DSP资深工程师7444

音频算法（DSP）专家7446

中国电信的其他在招职位

中国电信的其他在招职位