京东的测试开发（大模型评测方向）薪资是多少？

该职位薪资范围为 25k–45k（人民币/月）。

测试开发（大模型评测方向）的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求本科学历及中级经验工作经验。

🤖 AI 估测：¥25K-45K

发布时间：30 天前

这是一个专注于大模型评测的测试开发岗位

你将参与构建覆盖文本、音视频及具身模型的统一评测体系，设计评测指标与方法，并负责自动化评测与判分策略的实施

核心目标是支撑模型版本迭代与业务应用，确保评测结果的可靠性与有效性

参与建设覆盖文本、音视频及具身模型的统一评测体系，设计并落地模型评测方法与指标体系

面向基座模型，构建通用能力评测（理解、推理、事实性、安全性、鲁棒性等），支撑模型版本对比与演进决策

面向业务侧（客服、导购、搜索、推荐等），抽象业务目标，设计专项评测指标、用例集与评测方案

负责自动化评测与判分策略（规则 / 模型判分 / 多模型互评），并协同人工标注体系提升评测可信度

参与评测数据集建设，包括数据采样、难例挖掘、数据版本管理与评测结果分析

与工程团队协作，打通模型数据 – 实验 – 评测全链路闭环

本科及以上学历，计算机、人工智能、自动化、机器人等相关专业

熟悉至少一个方向：LLM/多模态/语音/具身智能数据、训练或评测

具备将“业务问题”转化为“可量化评测指标”的能力

对评测结果的稳定性、可复现性、统计显著性有基本认知

符合京东价值观：客户为先、创新、拼搏、担当、感恩、诚信

有模型评测、Benchmark、自动化评测或数据标注相关经验优先

测试开发（大模型评测方向）

🤖 AI 估测：¥25K-45K

发布时间：30 天前