Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/康明斯/AI Lab - LLM Applied Evaluation and Benchmark Intern
Cummins logo
C
康明斯 (Cummins)

职位信息

北京市
无经验要求
实习生
仅现场办公
本科
实习/见习

标签

数据分析RAG软件测试LLMPrompt EngineeringAI Agent数据脱敏
💡

核心评价

前沿AI技术实习岗,成长空间大,平台稳定,但需现场办公。

AI Lab - LLM Applied Evaluation and Benchmark Intern

🤖 AI 估测:¥6K-10K

发布时间:26 天前

立即应聘

ℹ️关于这个职位

这是一个面向在校学生的AI大模型应用测评实习岗位
你将专注于Chatbot、ChatBI等大语言模型(LLM)应用在汽车与工业领域的测试、评估与优化工作
核心任务是设计评测体系、构建基准数据集,并通过分析模型行为(如幻觉、逻辑错误)来提升系统的质量与可靠性

✓工作职责

设计并执行大模型应用评测:针对Chatbot与ChatBI等应用,设计系统化测试方案,包括功能测试、逻辑测试与边界测试
构建评测数据与指标体系:构建评测数据集,并设计评估指标(如准确率、鲁棒性、一致性、幻觉率等)
参与Agent应用搭建与测试:参与AI Agent系统的构建与测试,验证多步骤推理与工具调用能力
执行模型输出评估:结合人工评测与自动评测(如LLM-as-a-judge)评估模型输出质量
分析模型问题与行为:识别模型幻觉、逻辑错误、偏差等问题,并提出优化建议
数据处理与脱敏:进行数据清洗与脱敏(如匿名化、掩码处理),确保符合数据隐私要求
撰写评测报告:输出评测方法、结果分析及优化建议,并向相关方汇报
向团队成员和相关方展示成果与洞察

⭐最低要求

计算机科学 / 数据科学 / 人工智能或相关专业本科或研究生在读
熟悉软件测试方法:了解测试用例设计、边界测试与逻辑验证
具备良好的逻辑分析能力:能够系统性设计评测场景并识别问题
熟悉大语言模型(LLM)相关技术:如Prompt工程、RAG、Agent框架等
熟悉Python或其他编程语言:具备基础数据处理能力
了解数据隐私与脱敏方法:如匿名化、数据掩码等
具备良好的学习能力、问题解决能力和团队合作精神

👍优先资格

有Chatbot或数据问答相关经验者优先
熟悉AI开发框架(如LangChain, LlamaIndex, OpenAI API)者优先
有SQL或数据分析经验者优先(适用于ChatBI场景)
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

康明斯 的其他在招职位

  • Student - Eng

    康明斯

    北京市 · 仅现场办公

  • Tax Intern

    康明斯

    北京市 · 仅现场办公

  • Student - Fin

    康明斯

    北京市 · 仅现场办公

  • Intern - Reliability Engineering

    康明斯

    北京市 · 仅现场办公

  • Intern - Combustion and Emissions Systems

    康明斯

    重庆市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公