笔试+上机(最关键,笔试过不掉救不了)
- 100分笔试,机器学习,模式识别,数据结构与算法,知识推理(zyz,英文题,要看一下),人工智能,概率统计(简答题,其他是选择填空)
- 50分编程题,什么方向不知道,应该和机器学习和算法相关。
- 月底组内,积累点经验,问一下学长,口语是怎么样的。
- 本校有一定的优势,尽可能做好,题量不少,做不对略过即可,不要纠结。
- 大数定理
- 中心极限定理
- 全概率公式
- 最大似然估计
- 贝叶斯公式:接着看论文的老师问我朴素贝叶斯决策相关的内容,朴素贝叶斯我还是会的,说了一下思想和公式。然后他问我,朴素贝叶斯是独立分布还是独立条件分布?我当时不知道是怎么的鬼使神差,答了个独立分布...只能说脑子瓦特了,那天状态真的特别差。后来知道老师问我这个问题的原因是我在论文中用了大量条件分布的东西。
- 网上那些脑筋急转弯
- 独立同分布:为什么机器学习中的基本假设是独立同分布,独立同分布全称是什么?(这个地方卡了,对面嫌我说多了)
西瓜书前十章精通
- 对机器学习/深度学习的理解
- 开放动态环境下机器学习的认识(来自南大某著名实验室)
- PCA:简述PCA的计算过程,PCA的全称是什么
- SVM:简述SVM,并解释SVM为什么要化对偶形?百万样本量可以用SVM吗?(我答:虽然可以通过现成凸优化包求解,但是对偶问题求解更快)为什么更快?
- 讲一个你知道的聚类算法?
- 集成学习:简述几种集成学习方法,Adaboost的计算过程,以及Stacking Learning?Boosting的基本思想?Boosting学习有什么特点?为什么集成学习需要集成“好而不同”的学习器?介绍Xgboost的优势
- 常用的机器学习算法的适用场景(例如KNN、朴素贝叶斯、决策树等)
- PAC理论:PAC理论的全称是什么?PAC理论了解多少?
- 具体阐述残差神经网络的含义
- 梯度消失和梯度爆炸是什么意思?有什么样的方法进行改善?
- 介绍一下梯度下降法是什么
- 介绍一下牛顿迭代是什么
- 为什么机器学习中的基本假设是独立同分布,独立同分布全称是什么?(这个地方卡了,对面嫌我说多了)
- $ \epsilon $ -greedy:就问了一个“ε-greedy”算法中ε取值的问题
- 决策树一些更加深入的东西
- 机器学习中FP、TP是什么?
-
数据结构 考的巨多 建议精通
-
时间复杂度分析
-
渐进
-
动态规划:背包问题
-
摊还
-
排序:
- 排序:算法,平均最优最坏时间复杂度以及空间复杂度。黑板上手写证明。排序为什么要稳定。
- 快排:平均、最优、最坏复杂度。最坏情况是什么样?优缺点。
- 归并:平均最优最坏时间复杂度以及空间复杂度,优缺点。
- 既然归并的最坏也是 $ O(n\log n) $ ,而快排最坏 $ O(n^2) $ ,为啥现在大家都用的是快排。(我只从空间复杂度进行了分析,后来面完查了下,其实实践证明,虽然二者时间复杂度相同,但快排还是要快一些,而且最坏情况遇到的可能性也比较低。)
-
P问题 NP问题 NP完全问题的概念
-
直接问我红黑树了,我有点傻眼了,老实说自己不会,只知道STL有些底层是红黑树实现的(有时间还是得看下红黑树,至少得了解思想)
-
图
- 如何判断图中是否有环
- 欧拉图是什么?判定方法?
-
TopK问题详解,“快速选到第n个数”(快速选择,复杂度为 $ O(n) $ )
-
C++中new和malloc的区别
-
双蛋问题,但是单蛋版,也就是你只有一个鸡蛋如何判定其不摔碎的最高楼层?
-
智力问题,黑白帽子问题(可自行百度)
-
霍夫曼编码的优势,霍夫曼编码的唯一性,香农编码是什么?
-
散列表的优势(相比其他查询方式),查询复杂度(分链表型和普通型)
- svd(奇异值分解)
- 讲一讲线代中的矩阵的特征值?什么是特征值,特征值的含义,特征值分解
- 正定矩阵是什么?
- 如何理解矩阵的秩?线代中的矩阵的秩和矩阵的关系?
- 简述向量组线性无关的含义?
- 矩阵分解的物理意义?
- 半正定矩阵的定义,性质(越多越好),PCA协方差矩阵的性质(半正定),以及为什么半正定(从原理上说明)?
- 凸优化带约束的一阶条件
- 凸优化中梯度下降的学习率如何确定?(凸优化最后两课讲的)
- 操作系统线程跟进程的区别等(操作系统的问题比较爱问)
- 常微分方程f'(x) = cx的解的形式,如果c是常数,为什么形式,如果c为矩阵呢? $ \frac12x^\top Cx $
- 傅里叶变换和拉普拉斯变换的关系?拉普拉斯变换的用处?
- 一分钟自我介绍,遇到的挫折是什么
- 研究生的“研究”二字是什么含义?研究生相比本科生有什么区别?
- 比如如果离交稿ddl还剩两天,但是你的实验还有很大漏洞,论文也还没写完,这种情况怎么办
- 英文面试
- 1分钟自我介绍
- 从事的研究细节(因为自我介绍中提及)
- 你最感兴趣的课程
- 你以后是想留在学校做研究还是去公司工作。
- 如何利用文献检索知识去检索一个机器学习的问题
- 你研究生读完之后有什么打算?你有什么做研究的品质?
- 最大子串和(给了一堆正负的数字,任选其中一段连续的数字(可以全选),需要和最大);无向图最长路径(单纯的Dijkstra);表达式求值(例如 (3*2+1/2)+1*2,计算结果);给一棵树求最长的路径(根到叶节点)。
- 南大的机试,我觉得重点是DP、搜索、图论
-
题量:应该是100道差不多,时长90分钟。
-
题型:单选题、多选题、填空题、英文问答题。
-
考察内容:
-
线性代数(有复杂计算,我遇到了张宇考研数学的原题)
- 概率论(有奇怪的伤脑筋的题,得多练)
- 数据结构(重点,有考察排序算法、链表)
- 机器学习(把西瓜书看看就行,考的都是知识点,概念性的东西)
- 印象中没有计组计网操作系统
- 可靠性(Soundness):在命题逻辑中,可靠性是指逻辑系统的一个属性,表示该系统中的推理规则是正确的。如果一个逻辑系统是健全的,那么任何从该系统的有效前提推导出的结论都是真的。换句话说,如果一个论证是健全的,那么它不会导致从假前提推出真结论的情况。
- 完备性(Completeness):在命题逻辑中,完备性是指逻辑系统的另一个属性,表示该系统中的每个真陈述都可以在该系统中被证明为真。换句话说,如果一个逻辑系统是完备的,那么对于任何为真的陈述,系统中存在一个证明或推理来证明它的真实性。