接着看论文的老师问我朴素贝叶斯决策相关的内容,朴素贝叶斯我还是会的,说了一下思想和公式。然后他问我,朴素贝叶斯是独立分布还是独立条件分布?我当时不知道是怎么的鬼使神差,答了个独立分布...只能说脑子瓦特了,那天状态真的特别差。后来知道老师问我这个问题的原因是我在论文中用了大量条件分布的东西。
最后是我觉得最奇怪的一个问题,老师问quick sort,我一下就来劲了,quick sort我熟啊,刚复习的。然后老师问我,快排为什么叫快排啊?我“?????”我弱弱的回答“因为它快啊...”。老师又问我“它是最快的吗?”我“不是啊,快排是nlogn,基数排序能到O(n)呢”。老师问“那基数排序有什么代价呢?”我说“它需要大量的空间啊,空间换时间”。然后我就楞那里了。老师“你还是没回答我的问题啊,快排为啥叫快排啊?”我“...”。
之前对于算法,重点去掌握了它的流程,它的代码,忽略了一些特别关键和基础的点,比如什么大数定律,条件分布,决策树一些更加深入的东西,没有记忆在心中。对自己的项目也没有深挖,还是要不断反思,这个项目的核心是啥,遇到了什么困难,有什么收获。
一轮:自我介绍 概率题 算法题 项目简介 二轮:自我介绍 你大学最满意的项目是什么 详细问 听说有三轮 但我没过第二轮
自我介绍 老师完全按照简历询问
重点: 1.线代+概率 线代主要是概念 概率主要是网上那些脑筋急转弯 2.机器学习 建议西瓜书前十章要精通 3.数据结构 考的巨多 建议精通 4.算法 时间复杂度分析 渐进 背包问题 摊还 非重点: 博弈论 各种变换(傅里叶啥的 俺没学过)
英语面试:是学院的一个越南老师面试 比较亲切 但我心态崩了 三个问题: 1min自我介绍(超时会直接截止 不要问我为什么知道) 最喜欢的课程 why 最喜欢的机器学习算法 中文面试: 快速排序和归并排序优缺点 排序为什么要稳定 P问题 NP问题 NP完全问题的概念 全概率公式意义 项目问题
面试问了我大概五道题,一道问排序算法,及时间复杂度。第二道问我svd是什么。第三道是关于我最喜欢的深度学习模型。第四道和第五道是围绕我的项目经历问的。然后计算机营和ai营机试:面试比好像不一样。另外,ai院报周志华和lamda组的很多,但其实lamda在这之前已经招过一次了,所以夏令营他们再招的名额可能会比较小。
大概在报名结束后一周收到了第一次面谈的邀请邮件,LAMDA都是提前一天发邮件,第二天直接面试。这时候还在期末考试阶段,比较紧张,也没准备啥,就对着简历花了一小时思考了下。第一轮我们组是10个人,按姓名拼音排序进行面试的,面试官是组里的三个学长,先进行自我介绍,之后主要问了我以下三个问题:
详细介绍了下比赛(我参加过一个数据挖掘的比赛)的特征工程,之后又问了模型部分(介绍了下Xgboost) 对机器学习的理解(这个感觉自己答得不是很好,说的有点绕进去了) 对开放动态环境下机器学习的挑战和瓶颈的认识(这个后来我查过,是那个学长的博士课题,听DJW学长说这个也是LAMDA组里的一个大坑,ps. 这里大坑指大方向,不是说坑,有学弟问了才发现有人会误解emmm)
总的来说,这一轮面试比较愉快,主要了解一些基本情况吧,感觉这一轮没有刷人。
第一轮面试结束第二天就发下一轮通知了,询问D学长了解去年的流程后,也大概猜到了这一轮可能是群面,面之前学长还说遇到ZDC老师坐等聊爆,结果8:50进入腾讯会议,我傻眼了,一奶即中。
首先还是少不了自我介绍,介绍完之后Z老师就问我对博士期间的规划,这个问题之前思考过很久,也是一个保研期间的必问问题,由于我把规划从大四说起(大四如果保研顺利结束想先强化学习数学基础,说了凸优化、随机过程、矩阵分析之类的),也给后续埋了个坑——下一个问题他问我最喜欢哪门课,我以为他想问上面三门,就问了句是不是本科阶段,被WW老师说难道你还有研究生阶段吗,有点尴尬。我作死的说了数据结构(但我确实真的很喜欢数据结构,其他课也没准备,想着数据结构学的还行就说了),但直接问我红黑树了,我有点傻眼了,老实说自己不会,只知道STL有些底层是红黑树实现的(有时间还是得看下红黑树,至少得了解思想)。
之后就是一连串的问题,先问了归并和快排的平均、最优、最坏复杂度,这个准备实习面试时都梳理过,都答出来了。然后接着这个问题问,既然归并的最坏也是O(nlogn),而快排最坏O(n^2),为啥现在大家都用的是快排。我只从空间复杂度进行了分析,后来面完查了下,其实实践证明,虽然二者时间复杂度相同,但快排还是要快一些,而且最坏情况遇到的可能性也比较低。之后问的应该是如何判断图中是否有环,我刚嘴里小声复述想思考下,老师就直接问下一个问题了,这里感觉这一轮应该就是压力面。
下一个问题问的是比赛,让我介绍Xgboost的优势,这个实习面试也复习过,答得还可以。接下来WW老师问我本科学校是985吗?是211吗?是双一流吗?一波三连搞得我有点尴尬,我校果然在南方知名度还是不行。
最后Z老师又问你本科北京的学校为啥想来南京,说以前很多北京的同学拿了offer又鸽了。这个问题就有的聊了,因为我本身是江苏人,高中物理竞赛又在南大两个校区住过一段时间,挺喜欢南大的,南大也算是高中dream school之一了,然后就是LAMDA很强哈哈哈哈。
总结一下,这一轮面试节奏很快,可能也是面试过程中比较兴奋,我整体回答问题几乎没有思考,没有用到10分钟应该。这一轮面试应该刷了一半人左右。
这一轮面试一直到6.21晚9点才通知,大部分人收到的邮件都写明了是哪个老师面试,根据这两轮小组面试人数的猜测,可能第二轮刷了有一半人,但不确定,也可能是分批。我的邮件没有写明老师,我第一志愿是JY老师,但听D学长说J老师学生有部分也都是Z老师带,所以猜测可能会使Z老师面。D学长给我看了他去年整理的面试经历,大概了解了一些情况以及基本问题。这时候由于已经期末考完了,但也没想到面试这么突然,也来不及准备太多,就稍微过了下线代和概率论的一些基本概念,理解了一下,然后准备了一下简历。
最终面我的还是J老师。第一个环节还是自我介绍,介绍完之后老师开始问“以后的规划”、“家庭背景”、“家人对自己的规划”等等,接下来又问了“简历中的数据挖掘比赛主要负责的内容以及收获”、“本科科研项目最大的收获”等问题,都很友好,聊了大概20多分钟。
人工智能学院的笔试主要考人工智能+计算机的基础知识。笔试用考试星机考的方式,考试时长2小时,大概我记得200道题目左右,应该是比2020年的笔试少了50道题目左右,题目难度适中,因为难题我全刚开始跳了,我差不多连猜带蒙在最后差10min的时候完成了所有题目。南大学院笔试的考核真的很重要很重要,属于超强committee,即使你提前被周老师录了,笔试没过也是没用的。
参营时间线的话,是2021.7.8举行笔试,然后7.11周日上午(当时正在看美洲杯决赛,印象深刻)出了笔试的结果,应该是进60%~70%左右的人。笔试结果出了后,就会让你选择学硕or直博。南大一般在这个时候才会让你选择学硕和直博,刚开始报名的选择只是预选择。下面就是面试,7.13一整天是学硕面试,7.14上午是直博生面试,直博面试应该有22人,录了多少我也不是很清楚,下面说说面试情况。
线上面试还是采用的腾讯会议,每人12min,4min英语问答+8min专业知识。我那组的面试官有4人,面试可以说是相当友好了,英语问答包含自我介绍,以及一些关于我科研的提问,还有一些闲聊,英语这部分总体来说不难,敢于去说就行。专业知识部分,主要还是在问机器学习+线性代数的相关知识,我感觉我个人准备的比较充分,所有问题都回答出来了,除了最后詹老师的一个关于编码的问题回答的不太行。
关于机器学习面试的问题可以参考我另一篇经验贴:计算机/人工智能方向保研高频面试题目整理 ,这篇经验贴我应该概括的比较全面了。
开放型问题建议中英文都准备,大部分面试都有这个环节。
- 自我介绍(1min/3min)
- 研究生期间的规划
- 参与的竞赛(数模等等),你做了哪儿些工作?
- 简单介绍下你的科研工作
- 对机器学习/深度学习的理解
- 开放动态环境下机器学习的认识(来自南大某著名实验室)
数学类问题是ai方向保研面试问的最多的,主要是线代、概率论。
- 线代:如何理解矩阵的秩?简述向量组线性无关的含义?解释正定矩阵以及半正定矩阵?特征值的含义以及矩阵分解的物理意义?
- 概率论:简述大数定理,中心极限定理,全概率公式,最大似然估计,贝叶斯的含义
- P问题 NP问题 NP完全问题的概念
- 简述PCA的计算过程
- 简述SVM,并解释SVM为什么要化对偶形?百万样本量可以用SVM吗?
- 常用的机器学习算法的适用场景(例如KNN、朴素贝叶斯、决策树等)
- 具体阐述残差神经网络的含义
- 梯度消失和梯度爆炸是什么意思?有什么样的方法进行改善?
- 简述几种集成学习方法Adaboost的计算过程以及Stacking Learning?
- 常用排序平均最优最坏时间复杂度以及空间复杂度,阐述快排和归并的优缺点以及回答为什么排序要稳定?
- 归并排序的最坏时间复杂度优于快排,为什么我们还是选择快排?
- TopK问题详解
- 如何判断图里有环?
- C++中new和malloc的区别
南大AI的复试笔试是离散数学+机器学习;我是3月开学回学校才开始准备,这里建议早点准备离散,离散东西很多概念很杂而且考的也很难,所以我今年离散笔试应该基本没拿到分orz;今年的机器学习也不知道在搞什么,无语子,写着机器学习的label考了20道数据结构的选择题+一道不知道属于啥学科的问答,不过该准备的还是要准备的。 离散建议找一下南大本科的PPT,有重点地对着屈书进行复习;复试的机器学习建议细看一下,部分重点的数学推导要会(例如SVM的拉格朗日乘子法、KKT条件、PCA特征值分解),概念要十分清晰,即使复试没有考察到,面试老师也会问许多机器学习的相关知识。
今年情况特殊,是线上复试,因此今年的机试是和笔试在一起考的,但我想,随着疫情逐渐得到有效控制+全民疫苗接种,今后应该会继续采用线下机试的方法。 个人本科练习过半年左右的OJ,因此有一点薄弱的基础,因此就是在考前临时复习了一下黄宇书上的4道DP例题+一些常见的DP题(01背包、完全背包、LCS、多重部分和问题、LIS、DP计数等等)+一些常用的数据结构和算法(例如并查集、kruskal、dijkstra、快速幂、素数筛、线段数、树状数组等等)。 对于南大的机试,我觉得重点是DP、搜索、图论。
面试个人认为可以拆分成英语口语+线代+概率论+机器学习+项目经验+一些其它知识储备。 口语问了我这些问题:
1.本科所学专业 2.毕业后打算 3.兴趣爱好 4.介绍喜欢的电影 5.介绍最近读的一本书
面试:
1.你说你因为喜欢数据结构和算法才选择读AI,介绍一下它们的交集 2.本科有没有做过AI相关的项目 3.SVM为什么要采用对偶问题?(我答:虽然可以通过现成凸优化包求解,但是对偶问题求解更快) 4.为什么更快?(接4中我的回答内容 5.Boosting学习有什么特点? 6.为什么集成学习需要集成“好而不同”的学习器?(接5中我的回答内容 7.解释一下特征值的含义 8.简述一下特征值分解 9.为什么要选取前d大个特征值(接8中我的回答内容 10.你本科是软工的,问一下面向过程、面向对象、面向抽象的区别 11.具体介绍一下你学过的面向对象知识&应用 12.你觉得你本科所学的知识在将来读AI的时候会有哪些应用
面试吴建鑫老师的时候,问题如下:
方差的计算方法,他会提前写好一个方差表达式问你对不对,如果不对的话请写出正确的表达式; 方差中的n-1含义; 如果写一个程序计算方差,那么计算一次内存访问几次; 本科做过的项目,项目内容; 机器学习了解多少,看过什么; 了不了解本人是做什么研究的。 面试詹德川老师的时候,我不知道其他人是什么情况,但我是全程英文面试,问到的问题如下,注意:以下问题需要英文作答,实在英语回答不了,可以中文,不必有太大压力:
自我介绍一下; 介绍一下做过的项目; 介绍一下梯度下降法是什么; 介绍一下牛顿迭代是什么; 什么是特征值,特征值的含义; 唠嗑。 面试完当天晚上就会有邮件通知是否面试通过,最后我是被詹德川老师录取,但是通过LAMDA面试并不代表你就能100%能进入LAMDA读研了,最重要的一关是拿到南大夏令营的优秀营员,只有这样,通过两轮考核才能进入LAMDA。
下面说一下南大夏令营的流程,主要是三部分:各个实验室介绍、机试、面试,其中最最重要的是机试,只要机试通过,90%就能拿到优秀营员。
机试这次一共4道题,以前听说6道题,只要AC出其中的两道题就肯定没问题了,多做无用,有罚时,考核方式:OJ,题型:算法+数据结构,难度:ACM一般难度的题。这次的具体题目如下:
最大子串和; 无向图最长路径 表达式求值; 给一棵树求最长的路径。 面试问题如下(由于分组面试,每组没人问题不一样):
解释一下什么是时间复杂度; 快排的时间复杂度; 快排最坏时间复杂度为什么是$O(n^2)$,如何优化快排最坏时间复杂度; 看成绩单,问如何进行文献检索 英文回答:如何利用文献检索知识去检索一个机器学习的问题
就问了一个“ε-greedy”算法中ε取值的问题
然后问了离散的全序,偏序,操作系统,计算机组成原理内存啥的,还有居然问了软件工程的问题,真是醉了,那个时候软件工程都还没有学完。(黑人问号脸)然后,英文是让我介绍最喜欢的歌曲。
南大进行了一场霸面(不推荐,还是提早申请比较好)。
1.快排复杂度是多少,并且黑板上手写证明。
2.简述如何“快速选到第n个数”(快速选择,复杂度为O(n))。
3.讲简历上的项目,根据简历问
有无申请lamda都需要参加下面两场考试:
机试(两个小时,四选二,一般两道都做出来能入选):
1、连续最长子序列和(给了一堆正负的数字,任选其中一段连续的数字(可以全选),需要和最大)
2、无向图最长路径(单纯的Dijkstra)
3、给一个表达式,例如 (32+1/2)+12,计算结果
4、给了一棵树求最长的路径(根到叶节点)
面试:
1、英文自我介绍
2、按照不同专业方向问专业课程
3、大数定理、贝叶斯公式等
4、操作系统线程跟进程的区别等(操作系统的问题比较爱问)
考核方式:初审(985前5%) + 笔试 (机器学习、概率论、线性代数、数据结构等)+ 面试(机器学习、数学)
笔试:2小时做200多道填空和选择,其内容涵盖机器学习、概率论、线性代数、数据结构等。对于概率论和线性代数,建议耗时两三天刷完李永乐660,刷完就没问题。对于机器学习,建议把西瓜书前十章过一遍,主要是看概念即可。对于408,可以选择不看,考的不多。
面试:英语问答 + 专业知识考察。英语问答就准备好常见的英语问题,以及和你简历相关的英语问题即可。至于专业知识,就是考察机器学习和数学,建议把西瓜书或李航统计学细读并理解,数学建议把概率论和线代细读并理解。
总结:由于当时概率论和线代复习的不好,导致数学问题只答出一半,进入wl。要想过南大AI,没有别的秘诀!把线性代数、概率论、机器学习从头啃到位即可!
面试那天和我在一个房间,而且在我前面面,所以记录了所有的问题:
- 英语面试:
- 1分钟自我介绍;
- 从事的研究细节(因为自我介绍中提及);
- 你最感兴趣的课程;
- 你以后是想留在学校做研究还是去公司工作。
- 中文面试:
- 大数定律是什么?
- 中心极限定理是什么?
- 讲一个你知道的聚类算法?
- 你平时有什么放松方式?
- Boosting的基本思想?
- PCA的全称是什么?
- PAC理论的全称是什么?
- 欧拉图是什么?
- 正定矩阵是什么?
- 极大似然估计是什么?
- SVM为什么叫支持向量机?
注意,上述问题只是前置问题,你说不会才会换问题,否则就会继续问。比如同学A说他不记得欧拉图了,然后对面就换下一个问题;面试到我的时候又问了这个问题,我答出了欧拉图定义,后面就问我判定方法了。
-
英语面试:
- 1分钟自我介绍;
- 介绍一下你参加的比赛(起因于我的腾讯会议背景是我上次参加的某比赛,然后忘了换😢,反过来想这也是一种思路,让面试官问出你想让他问的问题😄);
- 以后的安排(类似于同学A的问题)。
-
中文面试:
-
大数定律是什么?(看我倒背如流就没问中心极限定理了)
-
计算复杂度(P和NP),P=NP吗?
-
遇到压力怎么放松?
-
最喜欢的课程?
-
介绍PCA;
-
为什么机器学习中的基本假设是独立同分布,独立同分布全称是什么?(这个地方卡了,对面嫌我说多了)
-
什么是欧拉图,如何判定欧拉图?(忘记了,只说记得存在一个充要条件)
-
正定矩阵是什么,如何判定?
跟面试官(王魏)怼了,他一直说我和书上的定义不一样,但我讲的是一个逻辑等价命题,他就说我不好好看书,弄得心态挺不好。幸好他是最后一个问问题的老师。
后来发现和我一组的同学都对他有意见的,比如同学B说他不会欧拉图,然后被他锐评:你是不是没上过数学课?
问同学C的时候,C回答不出来就咂嘴,问答少了就说”这么不熟悉吗“...
注:以上内容是节选,如果看的人多了就把老师名字给码了。感觉他是根据被面试者的态度进行反馈,比如我、B和C在面试的时候展现出自信,所以他很打压;A面试的时候很严肃,遇到不会的问题会说“对不起,我回去再看一下”,所以没咋刁难。反正看到的同学留个心眼吧。
-
快速排序的平均时间复杂度,最坏时间复杂度,最坏情况是什么样?
-
- 计算复杂度,但问的是:如果把时间换成空间,那么P=NP吗?
- PAC理论了解多少?
- TBD
这里记录其他组同学那里听来的问题:
- 喜欢的数学课?如果说了微积分这块,而不是AI相关,则会问:
- 中值定理是什么?
- 泰勒展开是什么?
- 高阶无穷小是什么?
- 傅里叶变换和拉普拉斯变换的关系?
- 拉普拉斯变换的用处?
- 双蛋问题,但是单蛋版,也就是你只有一个鸡蛋如何判定其不摔碎的最高楼层?
- TBD
NJUAI:
笔试:2h(记不太清了),题量很小,选择+问答
面试:英文自我介绍+英文专业问题+专业问题,南大是步步紧逼型面试,感觉问了不止十个问题。
比较迷惑的一点是面试是定死了12min/人,结果还剩20s的时候老师又问了一个问题,我刚说两句就直接结束了,这种情况主持人不应该提醒一下快到时间了吗(汗)
看了一些经验帖说,南大LAMDA比北大信科还难,有很多LAMDA面试没过的最后去了北大信科,所以我当初报名没报什么信心,找了一位和自己研究经历比较match的老师,就去参加了。
首先是初筛,985的5%应该都能过初筛,除此之外我觉得研究方向的match程度非常重要。
一面是学长面,先是一分钟自我介绍,然后就是基本的简历面,问了paper以及剩下几个科研项目做的是什么和创新点,差不多就结束了,没有问任何专业知识相关的问题。
二面是老师面,问题大概有:
- 一分钟自我介绍
- paper里我主要做的内容
- AI for SE领域有什么地方还可以去尝试?
- 最拿得出手的项目是什么
- 遇到的挫折是什么
- 你觉得图神经网络做代码生成目前的优点和缺点是什么?有什么改进的地方?
- 有没有做过词法分析器和语法分析器
- 智力问题,黑白帽子问题(可自行百度)
- 剩下就是一些聊天性问题,比如如果离交稿ddl还剩两天,但是你的实验还有很大漏洞,论文也还没写完,这种情况怎么办;了解了我的家乡以及为什么想来南京等
最后获得了实验室的offer,我个人感觉成功的原因是 1. 由于方向match,所以了解比较深入,中间考察的一些对该领域科研的相关看法时回答的还不错;2. 正好问到了我之前思考过的比较有意思的idea,所以和老师聊的很愉快。
但是!只拿到实验室的offer还没结束,还需要通过南大AI学院的考核,于是就有了绿裙里通过实验室考核没通过学院考核的难兄难弟们(后来发现这些难兄难弟里有人去了贵系,只想说南大AI真牛)
AI院笔试:题量很大,考察范围覆盖数据结构、机器学习(西瓜书)、概率论、线性代数、英语等,如果目标南大AI的建议提前好好复习一下。不要像我一样,“怎么还有过了LAMDA没过学院的” “小丑竟是我自己”
另:夏令营笔试寄了就彻底寄了,也没办法报名预推免了。
夏令营笔试是双机位,考试星作答。去年是两百道选择题和填空题两个小时,今年则是66道选择题,20多道填空题,若干多选题,英文题以及简答题,一共一个半小时。考察的科目和去年倒是差不多,这点知乎上也是有人写的,机器学习、概率论、线性代数、数据结构与算法,都是需要复习的。因为是线上考试所以不会有太多复杂的计算,更多考察知识的广度与细节部分,也就是看书复习的时候各种细节都应该注意。我根据前面大佬的建议也用了几天刷了李永乐660的线代和概统部分,感觉还是有不少帮助的。经过我们的讨论,感觉AI营的重点是笔试而非面试。
面试也是双机位,腾讯会议面试。以往都是20分钟一个人,今年估计是报名人数比较多,所以改为了12分钟一个人。还是4个老师分别问不同学科的问题。我这里大概记了一下面试的问题(不同的组面试题差别还是挺大的)
C:你研究生读完之后有什么打算?你有什么做研究的品质?(英文面试,有概率让你用英文自我介绍,也有可能没有)
詹:常微分方程f'(x) = cx的解的形式,如果c是常数,为什么形式,如果c为矩阵呢?霍夫曼编码的优势,霍夫曼编码的唯一性,香农编码是什么?
张:半正定矩阵的定义,性质(越多越好),PCA协方差矩阵的性质(半正定),以及为什么半正定(从原理上说明)?凸优化中梯度下降的学习率如何确定?(凸优化最后两课讲的)
姜:散列表的优势(相比其他查询方式),查询复杂度(分链表型和普通型)。研究生的“研究”二字是什么含义?研究生相比本科生有什么区别?
其他同学有问图灵机的,凸优化带约束的一阶条件的,中心极限定理,机器学习很多算法为什么要iid条件,SVM核函数的考察等等,比较广泛,只看西瓜书显然是不够的,还需要一些自己的思考和积累。
总体来说感觉面试是不断往深去问,老师会追问你问题的本质,直到不会为止。因此面试完成后问了一圈感觉都不是特别好,这也是正常现象。面试完之后就是漫长的几天等待时间。
7.11线上导师宣讲会,7.13开放日线上面试。
第一轮面试主要是实验室的学长学姐进行,主要围绕就是一些理论知识和你自我介绍的项目中所涉及的一些问题。
项目的问题没啥共同性,我就列举一些印象中的常见问题:
- 机器学习中FP、TP是什么?
- 你为啥想要读直博?
- 线代中的矩阵的秩和矩阵的关系?
- 讲一讲线代中的矩阵的特征值?
- ......
第二轮面试是意向导师单独面(我是这样的),L老师只是来聊了聊天,聊一下我想研究的方向和家是哪里的,为什么要来南大等等一些非学术问题,最后说因为直博已经确定了人选,只能给我学硕offer了。
-
题量:应该是100道差不多,时长90分钟。
-
题型:单选题、多选题、填空题、英文问答题。
-
考察内容:
-
- 线性代数(有复杂计算,我遇到了张宇考研数学的原题)
- 概率论(有奇怪的伤脑筋的题,得多练)
- 数据结构(重点,有考察排序算法、链表)
- 机器学习(把西瓜书看看就行,考的都是知识点,概念性的东西)
- 印象中没有计组计网操作系统