大家好,我是对白。

今天给大家分享一篇小伙伴的算法岗秋招总结文章,作者的背景是:1个腾讯实习、4个比赛、2个项目、1篇CCF-A二作和CCF-C一作,虽然网易、快手和百度都挂了,华为还在池子里,但最终拿下腾讯和字节的offer,希望能帮助到下半年准备秋招的小伙伴们,以下为原文。

一. 字节技术中台


一面(通过):

算法题:删除倒数第N个链表

面试题

1、为什么要用尖括号标记实体,尖括号在BERT词表中么,最好用unuse1字符;

2、FastText和Word2vec的区别;

3、Xgboost和Adaboost、GBDT、随机森林,随机森林如何采样;

4、怎么解决人工漏标、错标,NER的损失函数,关系抽取为什么用这个模型,有调研其它模型么;

二面(挂):

1、手撕编辑距离;

2、Xgboost如何分裂,公式,树的生成;

3、逻辑回归推导;

4、交叉熵;

5、softmax;

二. 字节电商


一面(通过):

1、逻辑回归求导、均方误差和交叉熵的区别;

2、防止欠拟合、过拟合、梯度爆炸的方式;

3、BERT结构、transformer中feed forward的作用;

4、self-attention的形式,为什么要除以根号d_k;

5、算法题:手撕kmeans,链表反转、扑克牌随机分3堆,大小王在同一堆的概率;

6、图最短路径算法;

二面(通过):

1、比赛:为什么使用注意力机制、介绍multi sample dropout;

2、注意力机制为什么不用多头;

3、矩阵相加和点乘;

4、SPU海量数据查重;

5、softmax;

6、手撕代码:前k个相似整数、最长不重复子串;

三面(通过):

1、比赛;

2、实习项目;

3、手撕代码:堆排序、组成某个值的硬币种数(回溯)、不相邻子序列最大和;

三. 华为消费者BG


一面(通过):

1、算法题:LeetCode 739 每日温度;

2、决策树算法有哪些:ID3、C4.5、CART;

3、TF-IDF特征;

4、BERT mask策略,分别的作用;

5、多模态建模思路;

6、上线部署时延要求,模型剪枝、模型蒸馏;

7、Transformer与LSTM相比,优势在哪;

8、Boosting算法的优缺点;

二面(通过):

1、实习项目;

2、为什么要finetune;

3、知识图谱技术路线,信息抽取综述;

三面(通过):

问的问题跟HR差不多

四. 阿里本地生活(上海)


一面(通过):

1、实习项目,fusion层,下一步如何优化,如何处理长文本;

2、语言模型,Word2vec,具体流程,损失函数,优化算法(hierarchical softmax、negative sampling);

3、逻辑回归损失函数为什么取log;

4、模型评估,F1、ROC-AUC;

5、kmeans聚类,向量距离不适合用欧氏距离衡量,如何变换;

6、CRF损失,实体识别有尝试其他算法么,关系抽取阈值有选择么;

五. 网易有道


一面(通过):

1、介绍中文人机对话技术评测比赛,别的队伍的优点;

2、介绍试题生成项目;

3、介绍BERT、attention公式,为什么除以根号dk;

4、介绍AAAI的论文,负责哪部分;

5、手撕算法:最小k个数、移掉k位数字;

二面(通过):

1、正则化有哪些;

2、深度神经网络为什么不使用sigmoid或tanh激活函数,什么情况下可以使用;

4、Self-attention时间复杂度;

5、手撕:循环递增数组查找、self-attention实现;

三面(通过)

1、给你一个项目,描述下你的技术路线;

六. 百度知识图谱


一面(通过):

1、Vggnet的Resnet的区别,Densenet;

2、Transformer在哪些地方体现了共享和并行;

3、is 和 ==区别;

4、re match 和 search;

5、range返回的是什么;

6、python内存管理、浅拷贝和深拷贝;

7、如何拼接字符串最高效;

8、手撕:二叉树层序遍历、连续子数组乘积最大;

二面(通过):

1、docker原理;

2、手撕:LRU;

3、场景题:给定一个文章,如何识别出所有观点(一个句子),如何识别出核心观点,如何识别出提出者

三面(通过):

1、实习项目背景、难点分析;

2、给定一个文本,如何抽取aspect、opinion、sentiment;

3、反问:部门规模、氛围、交流,管理;

**四面(通过):
**

1、比赛负责什么,每个人的分工;

2、情感识别的建模思路;

3、知识图谱:项目背景,有考虑意图识别么,实体消歧,为什么用pipeline、不用joint;

4、如果现在考虑的话该怎么提升模型性能;

5、CRF和HMM的区别,HMM解决哪三个问题;

6、CRF基于条件分布建模是什么意思,什么条件;

7、维特比思路,解决HMM的什么问题;

8、词向量发展历史:one-hot、NNLM、word2vec、glove(推导公式)、fasttext、ELMO、CoVE(不了解)、GPT、BERT、ERNIE(清华的不了解)、ERNIE 2.0、Bert-wwm、Roberta、Xlnet;



添加 博主 获取一线大厂面试真题