作者:求小红书offer!!
一面 40min
梯度下降为什么可以用当前点的梯度作为参数的最优更新方向?
知道二阶优化算法吗?
牛顿法的原理?
说说AdaGrad,momentum动量,有什么作用?
LSTM反向传播怎么进行的?
为什么能减少梯度消失?
有n个样本,分别有不同的权重,如何按照这个权重自己构造一种抽样?
n很大的时候如何改进?有一个游戏地图,可以上下左右走,有障碍物,如何找到起始点和终点的最短距离?如果地图很大,有什么改进方法?
二面 1h
项目逐个问,关注细节,你的角色,如何团队协作,有什么收获等等。扣得很细
推一下LSTM公式
LSTM如何减少梯度消失梯度爆炸?
CNN和BP神经网络反向传播,w和b的更新公式是否一样?
样本不平衡如何解决?
L1正则化和L2正则化区别?为什么L1能产生稀疏性?
easy-ensemble是什么?
给你offer的话能来实习吗?(当然可以,b站就在学校边上。当时听到这个一度以为很有希望??)
下面和我介绍了下他们团队的方向。
三面 40min
介绍一个最熟悉的项目,问了很多细节 算法题:给一个二叉树,判断是否是二叉搜索树 未来2-3年的目标
end