
普通员工/个人贡献者
AI 估算 · 30k–50k
大厂核心算法岗位,中级经验,北京薪资较高,月薪30k-50k合理。
作为大模型评测算法工程师,你将负责快手LLM、VLM等大模型的评测体系建设和自动化评测工具开发,通过算法手段进行模型效果评估与竞品对比,并探索基于模型内在机理的评测基准
硕士及以上学历,计算机、通信、人工智能、大数据、统计等相关专业优先
负责LLM、VLM、搜索推荐等大模型日常评测工作和评测体系建设,包括但不限于设计制定和完善评测方案、评测指标、评测数据收集和更新、评测执行,并输出专业评测报告,深度参与算法效果分析、挖掘问题归因
有参与大模型相关的项目(如LLM、VLM、搜索推荐、agent等任一均可)研发、评测经验优先,同时有大模型应用和research经验优先
优点
缺点 / 挑战
大厂核心岗位,前沿技术栈,发展空间大,但工作强度可能较高。
快手作为已上市大厂,薪资水平有竞争力,但JD中未提及具体福利,补偿性满足中等偏上。
职位聚焦前沿大模型评测,涉及LLM、VLM、AGI定义,技能成长空间大,且鼓励发表论文,发展性极强。
工作地点在北京,仅现场办公,未提及弹性工时或远程,WLB信号弱,可能加班较多。
大模型评测是AI发展的关键环节,推动AGI定义和行业标准,社会影响力与创新性均较高。