=============
自己算法菜鸡,本科双非二本电子信息,研究生德国 TU9 的信息技术。因为本科毕业在事业单位工作两年,所以研究生毕业算是大龄应届生了。在 18 秋招年还在读书的时候就听闻学长说到国内算法岗曾经开始卷了,然而那时候相对来说进大厂或者科技公司还算好进,有一些我的项目经验能进面试,还能够保小厂 offer。进入 19 年开始难度陡增,而 20 年在疫情下又缩招,算法更是灰飞烟灭。没有头部大厂算法实习或者独角兽算法实习很多简历都过不了,而口试难度也开始以 leetcode 的 medium 起底,时不时上一些 hard 题型。我之前的工作教训并不匹配算法,而实习尽管在德国车企的数据迷信部门做一些算法,然而业务深度因为疫情影响也不太够格。
我自身的方向是偏差数据挖掘的,所以我投递的比拟多是机器学习岗,数据挖掘岗,大数据分析岗。投递的畛域有互联网,金融科技,制造业,车企,研究院。不过往年春招竞争其实比秋招还要强烈,而很多公司的招聘需要并不多,JD 放进去然而并不捞人(也可能是我太菜了)。
华为(AI 培训工程师):这个是春招第一面,筹备很差,问了欠拟合过拟合,为何模型总是难以拟合真实情况,还有一个忘了,而后介绍下业务:他们是要给客户做 AI 技术培训的,要讲课,要常常出差。面试反馈感觉个别,然而还是进到第二轮 HR 面了,HR 面反馈说不太好,不适宜讲师这个岗位。
科大讯飞(NLP):一面自我介绍,问实习,问论文,问较量,介绍本人罕用的特色工程办法,问 word2vec 原理,python 装璜器是什么,没手撕代码。因为 c ++ 不熟一面挂。
兴业数金(数据挖掘剖析):一轮口试,通过后一面自我介绍,问实习,问论文,问较量,较量用什么模型,评估指标,决策树模型原理,xgboost 原理,xgboost 和 gbdt 以及 lightgbm 区别,如何用决策树做特色重要性排列,IV 值是什么,知不知道评分卡模型。一面之后没信。
中信信用卡(数据挖掘):一轮口试,通过后安顿一小时三连面,两轮技术面。一面自我介绍,实习,论文,问较量,RNN 和 LSTM 原理;二面问梯度降落原理,卷积核原理,简述欠拟合和过拟合能够预防的方法。面完始终在等音讯。
美团(数据开发):这个是意外投的,因为我意料算法必定是排不上,就投了简历稀缺的数开(口试只 ac 了不到两道的状况下还能进是真的稀缺)。一面问了实习(因为实习用到了 spark),如何搭建这个 spark 框架的,知不知道 rdd 是什么,SQL 写得多吗,数据库接触的多不多,如何解决数据歪斜,手撕最长回文串。
一点资讯(算法):一面介绍毕业论文,问实习内容,问较量内容,如何构建新特色,怎么做特色穿插,如何进行特色筛选,解释 FM 原理,LR+GBDT 中 GBDT 是如何结构特色,wide&deep 原理,做题和为 s 的两个数字。
明略科技(算法):一面自我介绍,问实习,因为面试管是 CV 组的大佬,问有没有接触过人脸识别,简略介绍下 Transformer,实习用的数据量大小,论文发到哪个会议了,做题判断带括号四则运算式子是否非法,非法输入后果。因为我做 CV 比拟少,俩人有点聊不到一起去,前面尬聊比拟多,挂。
伴鱼(数据挖掘):一轮口试,通过后一面上来间接做题:一道二维数组翻转求数组最大二进制和,没思路,挂。
PayBy(信贷 / 风控算法工程师):一个初创出海公司,主做阿联酋的挪动领取和信贷业务,往年尝试大量校招。技术面就有三轮,英语面一轮,HR 面一轮,前三轮轮都一个小时左右,总体感觉挺有技术积淀的。一面自我介绍,介绍毕设,挖实习,询问树算法原理,xgboost 的晋升点,AUC 是什么,高于和低于对角线示意意义,偏差和方差区别,手写几个 pandas 的代码,手写冒泡排序以及复杂度,介绍他们的业务;二面自我介绍,问比赛应用的模型,怎么做的特色工程,手写 LCS 和 Kmeans 算法;三面是技术主管面,询问深度学习做的多不多,是否解决过海量数据,实习中是怎么用 spark 的,手写判断回文;英语面是阿联酋的一个 HR 面的,英语自我介绍,职业规划,为何抉择留学。终面谈到工资,才发现出海业务的工资十分可观,如果有半年在境外,全年工资轻松能够上 35w。
腾景研究院(机器学习):一面问实习,问毕设,问较量模型,特色工程,问我的项目中的难点是怎么解决的,介绍他们的次要业务;二面竟然是技术群面,四个候选人挨个对于以后提出的技术或者趋势问题,以及以本人的我的项目教训如何解决他们提出的技术问题发表认识,而后会有 HR 和技术部门的人对候选人独自发问(搞得像是论文答辩的自在发问环节一样,两个半小时下来都虚脱了)。三面就是 HR 面,问简历经验,问冀望薪资,问留学,为何抉择回国等。
吉利(大数据挖掘 / 算法):吉利这个面试很奇葩,不预约间接打电话。第一次接到的是国地联结算法部门的面试,因为一二轮的面试官碰上了,所以间接合在一起面。问了实习中数据分析解决的需要,用什么算法,较量中又用什么算法,后果如何,介绍他们的业务,想做算法利用还是算法钻研,反馈挺称心,他们说间接交给 HR 等他分割我;第二次接到的是吉润的大数据挖掘,问实习中数据大小,特色有多少,如何抉择有用特色,问毕设,问 xgboost 对于 GBDT 的晋升点,晋升树的算法步骤,LSTM 的原理,ARIMA 原理,AR 和 MA 区别。HR 面先接到的是国地联结的,工资给的切实太低,拒了。
滴滴(算法):这个是在 boss 上受邀投的,所以间接进面试了,慢车分单业务部。长期换了面试官,然而一面依然面了一个多小时。上来也是自我介绍,而后写题,因为面试官长期上阵也没筹备,手撕是快排,两头在循环嵌套的中央有一个小谬误并不影响。而后进入我的项目深挖,挑一个较量细讲,讲工夫序列模型抉择,序列合成,特色筛选的原因,xgboost 中应用 feature importance 的判断条件,讲一下 DIN 模型的原理,以及 attention 的思维,LR 模型中为何应用穿插熵而不应用 MSE 作为损失函数(从损失函数建设的指标和成果上谈),CART 树的优缺点,DNN 中避免过拟合欠拟合的办法,如果训练集采样和全样本分布雷同,能够防止过拟合吗(不能,交换了非法则噪声的影响)。而后进入到反诘环节,问到业务部,技术栈,目前业务上的模型是哪些。整体面试体验十分好,没有压迫感,对每个问题都是在交换和探讨中度过的。当初在等二面。
挂在口试的:字节,网易,百度,360,奇安信。
挂在简历的:搜狗,海康,多抓鱼,车好多,满帮,manteia,龙湖,小红书。
没人捞的:安全,bilibili,小米,上海银行,搜狐,友塔,度小满,陌陌,便当蜂,永辉,soul 等等。
总结来说,因为我个人经历在算法这种要么 985 或者出名实验室毕业,或者在大厂算法岗实习或者有顶会论文的神仙打架的岗位上没有竞争力,所以还是比拟吃亏的。总体面试的难度互联网和 AI 独角兽 > 制造业和银行独立进去的科技公司 >= 小公司。比拟常见的面经可能应酬一些小公司的面试,然而一旦进入大厂面试,每个知识点会问到更基本的问题上,常常须要从数学,或者更高的视角去剖析因果,并且会对于每个我的项目(毕设,论文,比赛)的每个点都会打破沙锅问到底,所以要具体筹备。对于 LeetCode 这个还是早筹备,要多刷,多总结,刷到 400-500 道应该就能应酬大多数口试和面试了。