秋招被虐，最终拿下腾讯和字节offer

转载

程序员对白 2022-06-05 00:20:11

大家好，我是对白。

今天给大家分享一篇小伙伴的算法岗秋招总结文章，作者的背景是：1个腾讯实习、4个比赛、2个项目、1篇CCF-A二作和CCF-C一作，虽然网易、快手和百度都挂了，华为还在池子里，但最终拿下腾讯和字节的offer，希望能帮助到下半年准备秋招的小伙伴们，以下为原文。

一. 字节技术中台

一面（通过）：

算法题：删除倒数第N个链表

面试题：

1、为什么要用尖括号标记实体，尖括号在BERT词表中么，最好用unuse1字符；

2、FastText和Word2vec的区别；

3、Xgboost和Adaboost、GBDT、随机森林，随机森林如何采样；

4、怎么解决人工漏标、错标，NER的损失函数，关系抽取为什么用这个模型，有调研其它模型么；

二面（挂）：

1、手撕编辑距离；

2、Xgboost如何分裂，公式，树的生成；

3、逻辑回归推导；

4、交叉熵；

5、softmax；

二. 字节电商

一面（通过）：

1、逻辑回归求导、均方误差和交叉熵的区别；

2、防止欠拟合、过拟合、梯度爆炸的方式；

3、BERT结构、transformer中feed forward的作用；

4、self-attention的形式，为什么要除以根号d_k；

5、算法题：手撕kmeans，链表反转、扑克牌随机分3堆，大小王在同一堆的概率；

6、图最短路径算法；

二面（通过）：

1、比赛：为什么使用注意力机制、介绍multi sample dropout；

2、注意力机制为什么不用多头；

3、矩阵相加和点乘；

4、SPU海量数据查重；

5、softmax；

6、手撕代码：前k个相似整数、最长不重复子串；

三面（通过）：

1、比赛；

2、实习项目；

3、手撕代码：堆排序、组成某个值的硬币种数（回溯）、不相邻子序列最大和；

三. 华为消费者BG

一面（通过）：

1、算法题：LeetCode 739 每日温度；

2、决策树算法有哪些：ID3、C4.5、CART；

3、TF-IDF特征；

4、BERT mask策略，分别的作用；

5、多模态建模思路；

6、上线部署时延要求，模型剪枝、模型蒸馏；

7、Transformer与LSTM相比，优势在哪；

8、Boosting算法的优缺点；

二面（通过）：

1、实习项目；

2、为什么要finetune；

3、知识图谱技术路线，信息抽取综述；

三面（通过）：

问的问题跟HR差不多

四. 阿里本地生活（上海）

一面（通过）：

1、实习项目，fusion层，下一步如何优化，如何处理长文本；

2、语言模型，Word2vec，具体流程，损失函数，优化算法（hierarchical softmax、negative sampling）；

3、逻辑回归损失函数为什么取log；

4、模型评估，F1、ROC-AUC；

5、kmeans聚类，向量距离不适合用欧氏距离衡量，如何变换；

6、CRF损失，实体识别有尝试其他算法么，关系抽取阈值有选择么；

五. 网易有道

一面（通过）：

1、介绍中文人机对话技术评测比赛，别的队伍的优点；

2、介绍试题生成项目；

3、介绍BERT、attention公式，为什么除以根号dk；

4、介绍AAAI的论文，负责哪部分；

5、手撕算法：最小k个数、移掉k位数字；

二面（通过）：

1、正则化有哪些；

2、深度神经网络为什么不使用sigmoid或tanh激活函数，什么情况下可以使用；

4、Self-attention时间复杂度；

5、手撕：循环递增数组查找、self-attention实现；

三面（通过）

1、给你一个项目，描述下你的技术路线；

六. 百度知识图谱

一面（通过）：

1、Vggnet的Resnet的区别，Densenet；

2、Transformer在哪些地方体现了共享和并行；

3、is 和 ==区别；

4、re match 和 search；

5、range返回的是什么；

6、python内存管理、浅拷贝和深拷贝；

7、如何拼接字符串最高效；

8、手撕：二叉树层序遍历、连续子数组乘积最大；

二面（通过）：

1、docker原理；

2、手撕：LRU；

3、场景题：给定一个文章，如何识别出所有观点（一个句子），如何识别出核心观点，如何识别出提出者

三面（通过）：

1、实习项目背景、难点分析；

2、给定一个文本，如何抽取aspect、opinion、sentiment；

3、反问：部门规模、氛围、交流，管理；

**四面（通过）：
**

1、比赛负责什么，每个人的分工；

2、情感识别的建模思路；

3、知识图谱：项目背景，有考虑意图识别么，实体消歧，为什么用pipeline、不用joint；

4、如果现在考虑的话该怎么提升模型性能；

5、CRF和HMM的区别，HMM解决哪三个问题；

6、CRF基于条件分布建模是什么意思，什么条件；

7、维特比思路，解决HMM的什么问题；

8、词向量发展历史：one-hot、NNLM、word2vec、glove（推导公式）、fasttext、ELMO、CoVE（不了解）、GPT、BERT、ERNIE（清华的不了解）、ERNIE 2.0、Bert-wwm、Roberta、Xlnet；

添加博主获取一线大厂面试真题

上一篇：腾讯晋升≠调薪，还会降薪？

下一篇：作为审稿人，你什么情况下会选择拒稿？

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯