工作职责 文本大模型团队的主要负责小红书大语言模型的端到端全链路自研
主要研究方向包括: 1、持续探索大语言模型在不同阶段的高效scaling策略
2、预训练的关键技术探索: 包括从数据策略(筛选,配比,合成,学习效率的提升)、优化技术、可解释性,到下一代模型结构的设计、long context建模、学习范式探索等
3、通用alignment技术探索: 包括大规模RL的探索,持续提升大模型在通用能力、reasoning、长文本、agent、各方向中长尾知识等多个方向的综合能力,支撑更广泛的应用场景
4、跟下游的多模态同学一起探索端到端全模态大模型的设计和高效scaling策略