小红书的【Ace顶尖实习生】面向多业务场景的“多模态理解与生成”统一大模型基座研究薪资是多少？

该职位薪资范围为 8k–15k（人民币/月）。

【Ace顶尖实习生】面向多业务场景的“多模态理解与生成”统一大模型基座研究的工作地点在哪里？

该职位工作地点位于北京市、上海市、杭州市。工作形式为仅现场办公。

该职位要求本科学历及无经验要求工作经验。

🤖 AI 估测：¥8K-15K

发布时间：28 天前

这是一个面向顶尖实习生的研究岗位，旨在探索和构建一个统一的‘多模态理解与生成’大模型基座

你将致力于打破公司内部图文理解与生成模型之间的壁垒，通过底层知识共享，实现降本增效，并推动图像生成能力的提升

这是一个接触前沿AI技术、解决实际业务难题的绝佳机会

工作职责本课题希望探索有效的“多模态理解与生成”统一大模型基座方案，打破公司内部当前“模态隔离”与“任务隔离”的双重技术壁垒

目前在实际业务中，系统高度碎片化：一方面，我们维护着多套用于提取图文Embedding和标签的vlm理解类模型，以支持搜索和推荐的端到端建模

另一方面，我们独立部署了大量图像生成式大模型，包含用于社区封面生成、商品图修图、营销海报生成的图像生成模型（如基于Diffusion的文生图/图生图模型）

这种“理解与生成分离、文本与视觉割裂”的基建现状导致了极高的算力消耗、部署成本及维护代价

更关键的是，模型间存在“知识壁垒”——图像生成模型无法直接复用理解模型对业务商品逻辑的深刻认知，而推荐系统也无法享受到生成模型内部丰富的多模态精细化特征

因此，我们希望构建一套真正的多模态统一基座模型，实现输入端图文交错混合理解，输出端兼顾“高质量表征提取”、“文本生成”以及“图像生成”

通过底层世界知识的共享，实现降本增效，并利用多模态理解任务倒逼生成测能力的提升，产生图像生成能力增益效果

不限年级，本科及以上在读，计算机/人工智能/软件工程等相关专业优先

优秀的代码能力、数据结构和基础算法功底，熟悉Python等至少一门编程语言

熟悉大模型领域尤其是强化学习相关研究工作和算法，有大模型强化学习的研发基础

良好的沟通协作能力，责任心强，积极主动，能和团队一起探索新技术，推进技术进步

在ICML/CVPR/NeurIPS/ACL等顶级期刊会议上发表论文者优先

【Ace顶尖实习生】面向多业务场景的“多模态理解与生成”统一大模型基座研究

🤖 AI 估测：¥8K-15K

发布时间：28 天前