负责大模型方向技术的研究和应用,构建大规模通用智能系统,包括但不限于语言、多模态、行业大模型等
具体工作内容如下:
a. 负责开发和优化最先进的大模型算法,打造行业领先的大模型
b. 负责追踪大模型学术进展,预研前沿技术问题,打造行业领先技术影响力
c. 负责根据业务场景,抽象技术问题,预研和实现大模型技术,打造卓越的用户体验
针对语言大模型方向,工作方向包括但不限于:
a. 模型架构、预训练方法、高效微调、模型评估及迭代
b. 知识增强、工具增强、AI Agent
c. 幻觉、安全、时效性等问题解决
d. 训练和推理加速、模型量化、端测落地
e. 大模型核心能力提升,包括理解能力、知识能力、推理能力、生成能力和语言能力等
针对多模态大模型方向,工作方向包括但不限于:
a. 模型架构、预训练方法、高效微调、模型评估及迭代
b. 视觉信息语义分割与编码
c. 视觉与语言的语义对齐,多模态任务联合训练