面试回答什么是深度学习

转载

mob6454cc61df1e 2024-09-13 12:11:42

文章标签 面试回答什么是深度学习卷积目标检测数组 文章分类 深度学习人工智能

1.自我介绍
我叫XX，是来自XX大学的学生，现在做的方向是XX，目前做过的项目有XX，所熟悉的语言有XX。目前处于XX阶段。

2.Faster rcnn的优势是什么
(1)使用RPN(Region Proposal Network)代替原来Rcnn的Selective Search方法产生建议窗口
(2)FASTER-RCNN创造性地采用卷积网络自行产生建议框，并且和目标检测网络共享卷积网络，使得建议框数目从原有的约2000个减少为300个，且建议框的质量也有本质的提高

3.faster rcnn的作用和原理
(1)输入测试图像；
(2)将整张图片输入CNN，进行特征提取；
(3)用RPN（region proposal network）生成建议窗口(proposals)，每张图片生成300个建议窗口；
(4)把建议窗口映射到CNN的最后一层卷积feature map上；
(5)通过RoI pooling层使每个RoI生成固定尺寸的feature map；
(6)利用Softmax Loss(探测分类概率) 和Smooth L1 Loss(探测边框回归)对分类概率和边框回归(Bounding box regression)联合训练

4.ROI pooling的主要作用是什么？ROI align是什么?两个的区别
1）RoIPooling顾名思义对Roi进行Pooling操作，主要用于目标检测任务。RoI（Region of interest）指的是一张图片中认为有存在目标的区域。该操作的目的是对输入feature map中的不同大小的ROI利用池化方法获得固定大小的输出feature map。
2）对Roi的max pooling操作的kernel size记作A, 即A = 多层卷积后的feature map的size / fix feature map 的size
第一种办法：对A进行四舍五入（最近邻插值法）
第二种办法：不直接丢弃feature map的值，即改变A的值为多个不同的整数，使得划分多层卷积后的feature map的区域的个数等于fix feature map size ，然后对划分的每一个区域取最大值，即得到fix feauture map
RoIAlign针对第一种方法进行改进，何凯明在Mask RCNN中指出第一种方法会损失空间对称性，从而将最近邻插值法替换为双线性插值，并且命令为RoIAlign。
对于检测图片中大目标物体时，两种方案的差别不大，而如果是图片中有较多小目标物体需要检测，则优先选择RoiAlign，更精准些…

5.说一下 Faster rcnn anchor 机制，说一下 RPN
RPN的本质是 “ 基于滑窗的无类别obejct检测器 ”
anchor其实就是一堆有编号有坐标的bbox

6.Faster rcnn 有什么不足的地方吗？如何改进？
提取特征网络的改进：使用ResNet代替原来的VGG提取特征，效果显著
RPN升级版本：FPN
ROI升级：PS_RPI

7.BN 的原理
BN就是通过一定的规范化手段，把每层神经网络任意神经元这个输入值的分布强行拉回到均值为0方差为1的标准正态分布，其实就是把越来越偏的分布强制拉回比较标准的分布，这样使得激活输入值落在非线性函数对输入比较敏感的区域，这样输入的小变化就会导致损失函数较大的变化，意思是这样让梯度变大，避免梯度消失问题产生，而且梯度变大意味着学习收敛速度快，能大大加快训练速度。

8.可以介绍你经常用的 optimizer 吗？
SGD、AdaGrad、Momentum、NAG、RMSProp、Adam

9.解释一下什么是凸优化
凸优化“ 是指一种比较特殊的优化,是指求取最小值的目标函数为凸函数的一类优化问题

编程题：手推 SVM，补全 CNN 部分 BP 的代码

编程题：给定一个数组和滑动窗口的大小，找出所有滑动窗口里数值的最大值，就是平时写的滑动窗口最大值。

编程题： Leetcode 315 原题，线段树，好像也是一个算法竞赛题。

开放性题目：如何进行数据预处理，如何进行数据归一化等等，最后还抛出一个他们业务中正在做的项目中遇到的问题。

总结：百度面试，技术面试总共 3 轮，记得的题目就是上面这些了。感觉面试的范围还是很全面的，对编码能力和解决问题的能力格外看重。
商汤面试经历

还是介绍自己… …
看到你做过目标检测的项目，能说明一下你在项目中主要做了什么吗？
能解释一下梯度消失或者梯度爆炸的原因，以及如何解决吗？
请问你在 Faster rcnn 中使用的哪个基础神经网络模型，VGG 还是 ResNet? 能介绍一下常用的神经网络模型吗？
看到你使用过 LSTM，请问 LSTM 主要解决什么问题，它的三个门分别是什么，有什么作用？
能从数学层面分析一下梯度消失或者梯度爆炸的原因吗？
说一下 dropout 可以解决什么问题，为什么有效？
请介绍一下你常用的 Loss 函数， cross entropy 的原理是什么？
你知道的凸函数求极值的方法有哪些？我们在机器学习中经常使用梯度下降，为什么不使用牛顿法？
如何将高维的变量映射到低维？
过拟合的原因及解决办法
平时使用什么编程语言？请介绍一下 python 中闭包的作用？
c++ 中，类成员变量可否同时声明为虚函数和静态函数
编程题：找出数组中两数之和为指定值的所有整数对，时间复杂度为 O(n)
编程题：找出数组前 K 的数
开放性题目：一个 5 层的教学楼，每层有若干个教室和大于 2 个的楼梯，请建立一个数学模型计算出火灾发生时所有人员撤出的时间，并列出你考虑的主要因素
总结：商汤的面试，非常注重基础，喜欢能说出自己想法的候选人，博主在面试中多次和面试官 argue，比如在答第 10 题时，博主犹豫了一段时间，面试官提示：
你听说过 PCA 降维吗，这个问题可以通过 PCA 解决。我解释说，PCA 并不能完全解决您的这个问题，因为 PCA 只能解除线性相关，无法解决高阶相关性，
可以考虑 Kernel PCA。另外，整体感觉商汤的面试官幽默又不失严谨，博主常年在国外读书，
有时不知如何将一些专业术语翻译成中文，因此会再三和面试官确认问题，所以有了如下的对话：
面试官：你能解释一下 cross entropy 吗？
我：cross 什么？请问您说的是英文名字吗？
面试官：是，我是说的英文，哈哈哈哈
我：不好意思，我是担心我中文不好，真不是有意冒犯… …
面试官: 没事，是我英语太不好，哈哈哈哈，哈哈哈
然后是面试官长达半分钟的大笑，而我一脸懵逼 : )