深度参与过业界主流或知名多模态大模型的研发工作,系统理解整体技术架构与设计方案
具备大规模数据构建、清洗、治理及分布式模型训练的实战经验
精通大模型预训练、监督微调(SFT)、对齐与后训练(如 RLHF / DPO 等)等训练范式,深入理解相关算法原理、工程实现细节及训练稳定性与效率优化方法
精通通用 OCR、表格识别、版面分析、关键信息抽取(KIE)等文档智能核心技术,具备完整的业务落地或产品化经验者优先
具备扎实的工程实现能力,熟练使用 Python,具备良好的代码规范与系统设计能力,熟悉或精通 C/C++ 者优先