共计 2432 个字符,预计需要花费 7 分钟才能阅读完成。
01 苦楚的技术问答题评审
指针走到了九点,凝视着时钟的技术招聘官 Jasmine 从昏沉中回到事实,她将咖啡连同叹气一口抿了上来,并端正坐在电脑前。又是一天的评卷日……
技术招聘已继续数周,公司筛选出了 100 位嵌入式工程师候选人的技术测评答卷,每份评卷须要 30-45 分钟,100 份便是妥妥 50 个小时,想起来就头大。
审完十多份试卷后,她疲劳得切实须要劳动一下,但恍惚间一个不安的念头闪过她脑海……本人前后的打分是否统一呢?不足主观规范,让她的打分异样艰巨。
“如果 AI 能帮我评卷,那就好了 ……”
Jasmine 两眼无神,回望向时钟 …..
02 技术问答题的作用与评审时的问题
既然如此苦楚,为何 Jasmine 的公司还要采纳问答题进行技术测评呢?
比起常见的选择题、编程题,问答题更多须要候选人书写答案。除了考查候选人的具体知识点外,能从其解题思路与观点中,更加深刻理解他的设计思路、解决方案,和对概念的了解;从答案的逻辑性、组织性和完整性等方面,企业能够取得更多信息,理解候选人的深刻思考、逻辑与创造性思维。
但这类问题却给技术招聘官的评卷带来了微小的艰难,起因有如下两点:
1. 消耗海量工夫与精力
国外一份钻研显示,在技术测评中,思考到不同题型与难度,招聘官均匀须破费 30-45 分钟来评审问答题,而面向高阶技术工程师的问答题评审,甚至会高达 60 分钟。
一份对谷歌技术面试官的采访也示意,他们往往每周都会破费数十小时以上的工夫来评估问答题试卷,以决定候选人进入下一轮面试的资格。
从中可知,人工评估技术问答题,确实须要消耗海量工夫。
2. 评审主观性强,招聘官间不足统一共识
问答题因为没有明确的正确 or 谬误答案,导致每位招聘官对答复内容都有本人的了解。候选人是否具备某项能力,强烈依赖于该招聘官的个人观点;并且一个团队内招聘官 A /B/C,针对一个候选人的一个答案,还会产生三种不同的观点,导致“一千个哈姆雷特“的问题,彼此很难有一致性。
曾发表于《国内提拔与评估》杂志的一项试验就显示:实验者让 3 名评审人以 5 分制,对两位候选人的答卷进行评分,后果候选人 A 的评分为 5、4、2,候选人 B 的评分为 2、3、5,一个人的答卷,在不同人眼里存在着微小差值,可见评审极易受集体主观因素的影响。
正如招聘官 Jasmine 所想,如果能将 AI 引入简单的问答题中,将答案内容数据结构化,并根据算法建设精确清晰的评估规范,不仅能实现评分的一致性,还能通过自动化流程,节俭海量的工作工夫。
03 问答题 AI 评分——客观化、自动化,零工夫投入
随着人工智能高速倒退,AI 早已融入日常工作之中。ShowMeBug 深知 AI 的微小意义,采纳最新 AI 大模型,实现独有的问答题 AI 评分,打造全自动化、高可靠性的评分体系,评卷更加客观化、自动化,评卷工夫 0 投入!
ShowMeBug 主动 AI 评判性能的外围思路,在于设定了评分维度,并辅以 AI 自动化性能。通过更高效的自动化形式,节俭海量评卷工夫;并通过明确的评分标准,更主观地评估候选人的答案,保障高度一致性、可靠性、客观性的评分后果。
具体来说,AI 评分的高一致性使得同样答案的每次评分都雷同,屏蔽了主观因素烦扰;可靠性保障了评分是依据设定的维度所作出,让评分有规范可依;客观性使得评分后果仅围绕着维度的内容开展,不会思考与内容无关的角度。
咱们可举一例来阐明:
当初假如企业须要招聘 Java 后端开发工程师,那么技术面试官能够出题考查候选人 SQL 优化的能力,这时候企业能够在 ShowMeBug 后盾设置一道题来考核候选人在 My SQL 性能问题上的排查思路:
Jasmine 作为这家企业的技术面试官,可在试题参数设置中,关上内置的 AI 智能评分性能。ShowMeBug 预设了 19 种常见的评分维度,包含答题的准确性、完整性、技术深度、逻辑思维等等。
同时,ShowMeBug 也反对企业依据本身需要自定义评分维度。设置多种评分维度的目标,是为了防止不同评卷官可能会因为判断规范不同,而给出不同得分,导致评分后果带有较大主观性的状况。
设置好试题、试卷和考场后,企业邀请候选人 Shawn 进行技术测评。候选人 Shawn 很快就在 ShowMeBug 上提交完试卷。企业进入到了评卷环节。
企业进入评卷界面,咱们能够看到,AI 曾经依据刚刚咱们设置的评分维度,对候选人的答案进行打分,并提供了每个评分维度的评分理由。
AI 的使用,使得同一份答案屡次测评,所得的分数完全一致,防止了招聘官面对同一份答案,在不同工夫,或者不同招聘官之间,因集体主观因素所导致的评分差别,保障了每次测评的一致性与主观公正。
从上图可知,候选人 Shawn 针对该题在各维度上,均能满足根本要求,但在各维度上也有欠缺之处。当然,企业若针对该候选人,在这道题上的答复有本人的认识,也可在放弃评分客观性的同时,依据本人的业余判断和教训,进行适当的调整。
评卷后,招聘官可一键生成人才报告,将 Shawn 与其余候选人比照,也可发给其余招聘官一起评测,缩小集体主观判断的因素。
通过 ShowMeBug 问答题 AI 智能评分,企业便能以 AI 自动化形式,通过不同维度,测评海量候选人问答题的答案,帮忙她节俭大幅的评卷工作量;也能让技术面试官和我的项目负责人之间领有了一个主观规范,躲避彼此之间主观剖析产生的差别,对所评分数达成统一的共识;并最终深刻帮技术面试官考查候选人理论工作与深刻思考的能力。
看到这里,想必大家仍会对问答题 AI 评分性能产生疑虑:AI 的论断靠谱么?稳定性怎么样?
安心,ShowMeBug 针对 AI 评分的可靠性、一致性与客观性,进行了欠缺的性能测试,测试后果为:问答题 Al 评分具备较高的一致性和客观性,评分行为稳固,具备高的可靠性。
ShowMeBug 问答题 AI 评分测试报告
明天这篇就介绍到这儿了。等下,就这样了?当然远远不够,技术测评 +AI 曾经被咱们卷出新高度了~ 无关如何实现技术评卷工夫 0 投入,咱们还有 one more thing……敬请期待下一篇吧~:)