iFLYTEK logo
科大讯飞
AI研究算法工程师-多模态大模型方向(J12673)

AI研究算法工程师-多模态大模型方向(J12673)

发布于 大约 15 小时前

普通员工/个人贡献者

合肥市 / 广州市
无经验要求
全职员工
仅现场办公
硕士
研究与开发 (研发)
深度学习
强化学习
自然语言处理
计算机视觉
预训练
教育
医疗
多模态大模型

AI 估算 · 20k–35k

多模态大模型方向技术门槛高,硕博士学历,薪资处于行业中等偏上,合肥与广州两地平均水平。

职位详情

关于这个职位

该职位面向2027届硕士及以上学历学生,加入科大讯飞飞星计划,从事多模态大模型的前沿算法研究,涉及计算机视觉、自然语言处理等方向,研究成果将应用于教育、医疗、汽车等行业

你将专注于模型研发与实验分析,与团队共同推动AI技术落地

最低要求

届硕士及以上学历,专业方向在计算机科学、信息技术、电子工程或相关领域

对前沿算法有深刻的认识和理解,有CV方向算法研究经历
精通至少一种编程语言,如Python、C++等
能够独立思考和解决问题,具备较强的分析能力和创新能力
具备良好的沟通能力和团队协作精神

工作职责

负责计算机视觉(CV)和自然语言处理(NLP)的跨领域研究,独立完成代码实现和实验分析

研发业界领先的多模态大模型,研究多模态预训练、强化学习后训练等技术,面向教育、医疗、汽车等行业深度应用

优先资格

在人工智能会议(包括但不限于ACL、COLING、IJCAI、AAAI、ICLR、NIPS、CVPR、ICCV、INTERSPEECH、ICASSP)或期刊上发表过文章

在国内外知名评测任务或比赛中获得过优异成绩
在智能语音、计算机视觉、自然语言处理等相关方向有较丰富的实际系统研究和开发经验

AI 洞察

优缺点分析

优点

  • 前沿技术方向:多模态大模型是AI领域热点,积累经验后竞争力强
  • 大公司平台:科大讯飞AI头部企业,资源丰富,数据场景真实
  • 研究氛围浓厚:鼓励发表论文、参与竞赛,适合学术向人才
  • 多地可选:合肥和广州两城工作机会,生活成本不同
  • 技术门槛高:需要扎实的算法功底和独立创新能力,学习曲线陡峭
  • 竞争激烈:面向2027届提前批,候选人众多,需有突出成果

缺点 / 挑战

  • 工作强度较大:研究岗需要持续跟踪前沿,实验周期长,可能面临较大压力
  • 适合对CV/NLP有浓厚兴趣、希望从事前沿算法研究、并能承受高压力工作的硕博士学生

角色解读

  • 从算法研究员起步,逐步成长为多模态大模型专家,主导核心算法方向
  • 可向技术架构师或AI科学家方向发展,带领团队攻克技术难题
  • 在科大讯飞内部可横向转岗至教育、医疗等业务线,实现技术落地
  • 研究计算机视觉和自然语言处理的跨领域问题,设计并实现算法模型
  • 开发多模态大模型,包括预训练、强化学习等技术,推动模型在教育、医疗等行业落地
  • 独立完成实验分析、代码实现和模型优化,跟踪前沿技术动态
  • 扎实的CV或NLP算法基础,熟悉深度学习框架(如PyTorch、TensorFlow)
  • 精通Python或C++编程,具备良好的代码实现能力
  • 具备独立研究能力,能阅读并复现顶会论文,有论文发表或竞赛经验者优先

申请策略

  • 提前了解科大讯飞在教育和医疗领域的AI产品,准备与业务结合的思考
  • 关注飞星计划官方宣讲会,可尝试联系内部员工获取推荐
  • 重点突出CV或NLP相关项目经历,特别是多模态、大模型经验
  • 列出学术成果:发表的论文、参与的竞赛及排名
  • 展示编程能力:GitHub开源项目、代码库链接
  • 如有实习经历,强调在AI公司的研究或工程实践
  • 深入学习Transformer架构和预训练模型(如ViT、BERT、CLIP)
  • 动手复现经典多模态论文,积累代码实现经验

面试指南

  • 对于设计类问题,采用“任务定义→数据方案→模型架构→训练技巧→实验验证”的步骤回答
  • 对于理论类问题,先给出定义,再结合具体例子说明应用场景和效果
  • 对于开放性问题,展示思考过程,先分析问题关键点,再提出解决方案
  • 请介绍你参与过的某个多模态或多任务学习项目,遇到了哪些挑战?
  • 如何设计一个多模态模型用于图文检索?请从数据、模型结构、损失函数等方面说明
  • 你对自监督预训练和对比学习的理解?举例说明
  • 强化学习如何应用于大模型训练?谈谈RLHF的优缺点
  • 论文中常用的评价指标有哪些?如何评估多模态模型性能?

匹配度报告

66
综合匹配度

顶尖AI公司前沿多模态研究岗,技术成长极佳,但工作强度高,WLB一般。

适合人群
最适合重视技能成长和前沿技术、愿意投入高强度研究的学生。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利65
成长发展90
工作生活40
使命价值70

薪资福利匹配

65中等

该职位面向未毕业学生,薪资虽有一定竞争力但属于校招水平,福利全面但未在JD中明确列出,补偿性动机满足程度中等。

薪资信号未披露(AI估算:20K-35K/月)

成长发展匹配

90较高

职位聚焦多模态大模型前沿技术,鼓励论文发表和竞赛,成长空间极大,发展性动机满足程度很高。

技术前沿前沿/新兴技术
技术栈多模态大模型、计算机视觉、自然语言处理、强化学习、预训练
成长机会飞星计划
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及弹性工作或WLB相关福利,工作强度可能较大,生活化动机满足度较低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

研究应用于教育、医疗等有意义行业,但JD未强调社会使命,意义感动机有一定满足。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs