面经 | B站20校招算法岗(人工智能与技术部)【三面】_反向传播




作者:求小红书offer!!




一面 40min


梯度下降为什么可以用当前点的梯度作为参数的最优更新方向?


知道二阶优化算法吗?


牛顿法的原理?


说说AdaGrad,momentum动量,有什么作用?


LSTM反向传播怎么进行的?


为什么能减少梯度消失?


有n个样本,分别有不同的权重,如何按照这个权重自己构造一种抽样?


n很大的时候如何改进?有一个游戏地图,可以上下左右走,有障碍物,如何找到起始点和终点的最短距离?如果地图很大,有什么改进方法? 


 

二面 1h


项目逐个问,关注细节,你的角色,如何团队协作,有什么收获等等。扣得很细  



 推一下LSTM公式


LSTM如何减少梯度消失梯度爆炸?


CNN和BP神经网络反向传播,w和b的更新公式是否一样?


样本不平衡如何解决?


L1正则化和L2正则化区别?为什么L1能产生稀疏性?


easy-ensemble是什么?


给你offer的话能来实习吗?(当然可以,b站就在学校边上。当时听到这个一度以为很有希望??)


下面和我介绍了下他们团队的方向。 



三面 40min



介绍一个最熟悉的项目,问了很多细节 算法题:给一个二叉树,判断是否是二叉搜索树 未来2-3年的目标



end

面经 | B站20校招算法岗(人工智能与技术部)【三面】_正则化_02