关于程序员:怎么实现技术评卷时间0投入的上

52次阅读

共计 2432 个字符，预计需要花费 7 分钟才能阅读完成。

指针走到了九点，凝视着时钟的技术招聘官 Jasmine 从昏沉中回到事实，她将咖啡连同叹气一口抿了上来，并端正坐在电脑前。又是一天的评卷日……

技术招聘已继续数周，公司筛选出了 100 位嵌入式工程师候选人的技术测评答卷，每份评卷须要 30-45 分钟，100 份便是妥妥 50 个小时，想起来就头大。

审完十多份试卷后，她疲劳得切实须要劳动一下，但恍惚间一个不安的念头闪过她脑海……本人前后的打分是否统一呢？不足主观规范，让她的打分异样艰巨。

“如果 AI 能帮我评卷，那就好了 ……”

Jasmine 两眼无神，回望向时钟 …..

既然如此苦楚，为何 Jasmine 的公司还要采纳问答题进行技术测评呢？

比起常见的选择题、编程题，问答题更多须要候选人书写答案。除了考查候选人的具体知识点外，能从其解题思路与观点中，更加深刻理解他的设计思路、解决方案，和对概念的了解；从答案的逻辑性、组织性和完整性等方面，企业能够取得更多信息，理解候选人的深刻思考、逻辑与创造性思维。

但这类问题却给技术招聘官的评卷带来了微小的艰难，起因有如下两点：

1. 消耗海量工夫与精力

国外一份钻研显示，在技术测评中，思考到不同题型与难度，招聘官均匀须破费 30-45 分钟来评审问答题，而面向高阶技术工程师的问答题评审，甚至会高达 60 分钟。

一份对谷歌技术面试官的采访也示意，他们往往每周都会破费数十小时以上的工夫来评估问答题试卷，以决定候选人进入下一轮面试的资格。

从中可知，人工评估技术问答题，确实须要消耗海量工夫。

2. 评审主观性强，招聘官间不足统一共识

问答题因为没有明确的正确 or 谬误答案，导致每位招聘官对答复内容都有本人的了解。候选人是否具备某项能力，强烈依赖于该招聘官的个人观点；并且一个团队内招聘官 A /B/C，针对一个候选人的一个答案，还会产生三种不同的观点，导致“一千个哈姆雷特“的问题，彼此很难有一致性。

曾发表于《国内提拔与评估》杂志的一项试验就显示：实验者让 3 名评审人以 5 分制，对两位候选人的答卷进行评分，后果候选人 A 的评分为 5、4、2，候选人 B 的评分为 2、3、5，一个人的答卷，在不同人眼里存在着微小差值，可见评审极易受集体主观因素的影响。

正如招聘官 Jasmine 所想，如果能将 AI 引入简单的问答题中，将答案内容数据结构化，并根据算法建设精确清晰的评估规范，不仅能实现评分的一致性，还能通过自动化流程，节俭海量的工作工夫。

随着人工智能高速倒退，AI 早已融入日常工作之中。ShowMeBug 深知 AI 的微小意义，采纳最新 AI 大模型，实现独有的问答题 AI 评分，打造全自动化、高可靠性的评分体系，评卷更加客观化、自动化，评卷工夫 0 投入！

ShowMeBug 主动 AI 评判性能的外围思路，在于设定了评分维度，并辅以 AI 自动化性能。通过更高效的自动化形式，节俭海量评卷工夫；并通过明确的评分标准，更主观地评估候选人的答案，保障高度一致性、可靠性、客观性的评分后果。

具体来说，AI 评分的高一致性使得同样答案的每次评分都雷同，屏蔽了主观因素烦扰；可靠性保障了评分是依据设定的维度所作出，让评分有规范可依；客观性使得评分后果仅围绕着维度的内容开展，不会思考与内容无关的角度。

咱们可举一例来阐明：

当初假如企业须要招聘 Java 后端开发工程师，那么技术面试官能够出题考查候选人 SQL 优化的能力，这时候企业能够在 ShowMeBug 后盾设置一道题来考核候选人在 My SQL 性能问题上的排查思路：

Jasmine 作为这家企业的技术面试官，可在试题参数设置中，关上内置的 AI 智能评分性能。ShowMeBug 预设了 19 种常见的评分维度，包含答题的准确性、完整性、技术深度、逻辑思维等等。

同时，ShowMeBug 也反对企业依据本身需要自定义评分维度。设置多种评分维度的目标，是为了防止不同评卷官可能会因为判断规范不同，而给出不同得分，导致评分后果带有较大主观性的状况。

设置好试题、试卷和考场后，企业邀请候选人 Shawn 进行技术测评。候选人 Shawn 很快就在 ShowMeBug 上提交完试卷。企业进入到了评卷环节。

企业进入评卷界面，咱们能够看到，AI 曾经依据刚刚咱们设置的评分维度，对候选人的答案进行打分，并提供了每个评分维度的评分理由。

AI 的使用，使得同一份答案屡次测评，所得的分数完全一致，防止了招聘官面对同一份答案，在不同工夫，或者不同招聘官之间，因集体主观因素所导致的评分差别，保障了每次测评的一致性与主观公正。

从上图可知，候选人 Shawn 针对该题在各维度上，均能满足根本要求，但在各维度上也有欠缺之处。当然，企业若针对该候选人，在这道题上的答复有本人的认识，也可在放弃评分客观性的同时，依据本人的业余判断和教训，进行适当的调整。

评卷后，招聘官可一键生成人才报告，将 Shawn 与其余候选人比照，也可发给其余招聘官一起评测，缩小集体主观判断的因素。

通过 ShowMeBug 问答题 AI 智能评分，企业便能以 AI 自动化形式，通过不同维度，测评海量候选人问答题的答案，帮忙她节俭大幅的评卷工作量；也能让技术面试官和我的项目负责人之间领有了一个主观规范，躲避彼此之间主观剖析产生的差别，对所评分数达成统一的共识；并最终深刻帮技术面试官考查候选人理论工作与深刻思考的能力。

看到这里，想必大家仍会对问答题 AI 评分性能产生疑虑：AI 的论断靠谱么？稳定性怎么样？

安心，ShowMeBug 针对 AI 评分的可靠性、一致性与客观性，进行了欠缺的性能测试，测试后果为：问答题 Al 评分具备较高的一致性和客观性，评分行为稳固，具备高的可靠性。

ShowMeBug 问答题 AI 评分测试报告

明天这篇就介绍到这儿了。等下，就这样了？当然远远不够，技术测评 +AI 曾经被咱们卷出新高度了~ 无关如何实现技术评卷工夫 0 投入，咱们还有 one more thing……敬请期待下一篇吧~：）

正文完