ByteDance logo
字节跳动
医疗大模型评估运营(医学方向)-AI数据与安全

医疗大模型评估运营(医学方向)-AI数据与安全

发布于 1 天前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
数据标注
AI评估
医学知识
临床医学
质量验收
医疗大模型
自动评测
评测题集

AI 估算 · 20k–40k

字节跳动薪资较高,医疗AI方向人才稀缺,但非核心算法岗,薪资中等偏上。

职位详情

关于这个职位

该职位负责医疗大模型自动评测题集的设计与规划,确保题集专业、有挑战性

同时培训外部医学专家产出高质量评测题,并进行验收和优化
适合有临床背景并希望转型AI医疗的医学专业人才

最低要求

本科学历及以上,临床医学专业,具备扎实的临床或医学专业功底,具备临床工作或规培经验,熟悉临床诊疗流程与核心场景(需持有规培及执医资格)

熟悉医疗行业临床场景,同时具备医疗模型评测集建设相关项目经验,能核心参与设计医疗评测题集、输出种子样本,具备题集审核或医学评估相关经验者优先
具备良好的沟通培训能力,能积极高效引导外部专家完成难题产出,做好答疑与复盘工作,协同跨团队推进项目
严谨细致,具备较强的问题分析与判断能力,能准确完成题集验收与饱和度确认,保障题集适配医疗大模型自动评测需求

工作职责

结合医疗大模型自动评测集建设需求,负责医疗模型评测题集的设计与规划,输出高质量种子样本,确保题集贴合临床实际、兼具专业性与针对性,适配大模型自动评测的核心需求

培训并引导外部行业专家,结合其临床经验完成足量、高难度的评测题产出,全程提供专业答疑,做好过程复盘与问题优化,保障题集符合大模型自动评测的量级与难度要求
对回收的评测题集进行专业验收,结合医疗大模型自动评测特点开展模型饱和度确认,保障题集专业有效、对模型具备足够挑战性,支撑大模型自动评测的准确性与全面性
配合AI算法团队,结合医疗大模型自动评测需求,优化题集结构与内容,确保题集可适配自动化评测流程,助力提升评测效率与效果

优先资格

有医疗AI评测相关经验、具备自动化提效相关工作经验者

AI 洞察

优缺点分析

优点

  • 字节跳动平台大,AI资源丰富,积累医疗AI前沿经验
  • 岗位稀缺,结合医学与AI,提升跨领域竞争力
  • 工作内容有深度,能深度参与大模型评测,技术含量高
  • 需要大量与外部专家沟通协调,工作节奏可能较快
  • 字节跳动加班文化可能较普遍,需做好准备
  • 适合有临床背景、希望转型AI医疗、善于沟通且注重细节的医学人才

缺点 / 挑战

  • 医疗模型评测需极高准确性,压力较大

角色解读

  • 往医疗AI评测专家方向发展,加深模型评估方法论
  • 可转型为AI产品经理或医疗AI解决方案架构师
  • 积累AI+医疗经验后,可进入更多AI公司或医疗科技企业
  • 设计医疗大模型的评测题集,确保题目贴合临床实际且具备足够难度
  • 培训外部医学专家,指导他们产出高质量评测题,并全程答疑复盘
  • 验收评测题集,进行模型饱和度测试,支撑模型自动评测的准确性和全面性
  • 与AI算法团队协作,优化题集结构,适配自动化评测流程
  • 扎实的临床医学知识,持有规培和执业医师资格
  • 医疗模型评测或数据标注项目经验,能独立设计评测题集
  • 优秀的沟通培训能力,能高效引导外部专家产出
  • 严谨的问题分析和判断力,能准确验收题集

申请策略

  • 在面试中展示对医疗AI的热情和行业理解
  • 准备一个你设计的医疗评测题集案例,体现专业性和逻辑性
  • 突出临床经验,尤其是规培和执医资格
  • 如果有医疗AI项目或评测经验,重点描述
  • 展示培训或教学经历,体现沟通能力
  • 提前了解大模型评测方法和常用指标(如准确率、F1等)
  • 学习基础的自然语言处理知识,理解模型评测逻辑
  • 熟悉字节跳动的产品和技术栈(如豆包大模型)

面试指南

  • 结构化回答:先说明设计原则(临床相关性、难度分层、覆盖面),再举例具体操作步骤
  • STAR法则:描述情境、任务、行动、结果,突出个人贡献
  • 你如何设计一个高质量的大模型医疗评测题集?
  • 请举例说明你如何培训外部专家产出高质量数据
  • 如何验收评测题集,确保对模型有足够挑战性?
  • 医疗大模型评测与通用模型评测有哪些不同?
  • 如何处理与AI算法团队的意见分歧?
  • 复习临床常见诊疗流程,准备一些典型病例作为题集示例

匹配度报告

71
综合匹配度

大厂高薪、医疗AI前沿技术,但WLB一般、加班可能较多。

适合人群
最适合重视薪资和技能发展的求职者,但对工作和生活平衡要求较高者需慎重。
最强匹配
薪资福利匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展80
工作生活50
使命价值70

薪资福利匹配

85较高

字节跳动薪资福利在行业内具有竞争力,但未在JD中明确具体数字,整体补偿性较高。

薪资信号未披露(AI估算:20K-40K/月)

成长发展匹配

80较高

医疗大模型评测属于AI前沿领域,能积累稀缺技能,但未明确提及培训晋升路径。

技术前沿前沿/新兴技术
技术栈医疗大模型、自动评测、AI评估
业务类型ambiguous

工作生活匹配

50较低

仅现场办公,字节跳动通常加班较多,但JD未提及WLB相关信息。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

医疗AI对社会有积极影响,属于高速增长赛道,但具体社会价值未在JD中强调。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs