目录1. 一个超级大文件,每行一个url,求每一个url出现的次数1.1 如果是小文件1.2 如果是超级大文件2. 两个超级大文件,每行一个url,求两个文件中相同的url2.1 如果是两个小文件2.2 如果是两个超级大文件3. 一个超级大文件,每行一个url,快速查询出给定的url是否在这个大文件中3.1 如果是小文件3.2如果是超级大文件 1. 一个超级大文件,每行一个url,求每一个url
转载
2024-07-26 12:48:09
108阅读
Hive高频面试题1.Hive的架构及HQL转换为MR流程Hive元数据默认存储在derby数据库,不支持多客户端访问,所以将元数据存储在MySQl,支持多客户端访问。Hive架构HQL编译为MR任务流程介绍HQL转换为MR核心流程2.Hive和数据库比较1)数据存储位置Hive 存储在 HDFS 。数据库将数据保存在块设备或者本地文件系统中2)数据更新Hive中不建议对数据的改写。而数据库中的数
最近在深入了解Hive,尚硅谷的这5道题很经典,有引导意义,分步解题也很有用,故记录之,方便回看1.连续问题如下数据为蚂蚁森林中用户领取的减少碳排放量 找出连续 3 天及以上减少碳排放量在 100 以上的用户id dt lowcarbon 1001 2021-12-12 123 1002 2021-12-12 45 1001 2021-12-13 43 1001 2021-12-13 45 100
转载
2024-04-16 18:29:27
467阅读
Hadoophadoop中常问的就三块,第一:分布式存储(HDFS);第二:分布式计算框架(MapReduce);第三:资源调度框架(YARN)。1. 请说下HDFS读写流程这个问题虽然见过无数次,面试官问过无数次,还是有不少面试者不能完整的说出来,所以请务必记住。并且很多问题都是从HDFS读写流程中引申出来的。HDFS写流程:Client客户端发送上传请求,通过RPC与NameNode建立通信,
转载
2023-09-08 12:45:13
94阅读
目录一.Hadoop1.hdfs写流程2.hdfs读流程3.hdfs的体系结构4.一个datanode 宕机,怎么一个流程恢复5.hadoop 的 namenode 宕机,怎么解决6.namenode对元数据的管理7.元数据的checkpoint8.yarn资源调度流程 9.hadoop中combiner和partition的作用10.用mapreduce怎么处理数据倾斜问题
转载
2024-05-22 10:15:54
92阅读
本文是笔者在面试过程中被问到次数最多的一些问题,特此记录8.常用的hive导入数据的方式从本地导入数据到表中load data local '本地路径' into 表名称从hdfs导入数据到表中load data inpath 'hdfs路径' into 表名称表已存在,从别的表中查出数据导入到表中建表的时候从别的表中查出数据导入到表中(表并不存在)9.常用的hive导出数据的方式导出表中数据到本
转载
2023-08-10 11:27:24
104阅读
hadoop 2022 面试题总结了目录概述需求:设计思路相关代码如下:实验效果:分析:小结:目录概述hadoop 学习资料需求:设计思路相关代码如下:实验效果:待完成分析:16、FileInputFormat切片机制
job提交流程源码详解
waitForCompletion()
submit();
//建立连接:
Connect();//创建提交job的代理
///判断是本
1.Hive的架构 1.用户接口:Client CLI(command-line interface),JDBC/ODBC(JDBC访问hive),WEBUI(浏览器访问hive) 2.元数据:Metastore 元数据包括:表名,表所属的数据库(默认是default),表的拥有者,列分区字段,表的类型(是否是外部表),表的数据所在目录等; 3.hadoop 使用HDFS进行存储,使用MapRed
转载
2023-08-10 11:26:42
155阅读
目录1.描述一下hdfs的写流程 读流程?2.详细讲解一下hdfs的体系结构3.如果一个datanode出现宕机,恢复流程是什么样的?4.通常你是如何解决Haddop的NameNode宕机的,流程是什么?5.描述一下NameNode的元数据的管理 6.Hadoop集群中有哪些进程?他们各自有什么作用?7.讲解一下Hadoop中combiner和partition的作用8.你在MapRed
转载
2023-12-20 20:41:58
119阅读
hadoop面试题答案Hadoop 面试题,看看书找答案,看看你能答对多少(2)1. 下面哪个程序负责 HDFS 数据存储。a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker答案C datanode2. HDfS&
转载
精选
2014-02-07 17:35:39
773阅读
1.Hive 有哪些方式保存元数据,各有哪些特点。 15. Hive内部表和外部表的区别 23.hive底层与数据库交互原理Hive的Hql语句掌握情况? 36.使用Hive或自定义
原创
2021-07-29 11:00:12
343阅读
模块一 SQL(DQL)l 基本SQL 查询 l 运算符与函数 l 子查询 l 连接查询 建表语句emp.sql Part I(第一天) 01. 查询员工表所有数据, 并说明使用*的缺点 答: select * from emp; 使用*的缺点有 a) 查询出了不必要的列 b) 效率上不如直接指定列名 02. 查询职位(JOB)为'PRESIDENT'的员工的工资 答:
转载
2013-04-11 10:19:00
279阅读
2评论
基础题:
1.表单中 get与post提交方法的区别?
答:get是发送请求HTTP协议通过url参数传递进行接收,而post是实体数据,可以通过表单提交大量信息.
2.session与cookie的区别?
答:session:储存用户访问的全局唯一变量,存储在服务器上的php指定的目录中的(session_dir)的位置进行的存放
cookie:用来存储连续訪問一个
原创
2011-02-23 15:37:52
946阅读
java面试题及答案
原创
2013-06-05 23:25:44
747阅读
Spring 是个java企业级应用的开源开发框架。Spring主要用来开发Java应用,但是有些扩展是针对构建J2EE平台的web应用。Spring 框架目标是简化Java企业级应用开发,并通过POJO为基础的编程模型促进良好的编程习惯。
转载
2021-07-01 16:45:16
263阅读
1、作用域public,private,protected,以及不写时的区别答:区别如下:作用域当前类同一package子孙类其他packagepublic√ √√ √protected...
转载
2021-09-01 14:19:30
189阅读
由于JAVA面试试题涉及的范围很泛,很广,很杂,而且JAVA技术也在不断的更新换代,所以我们将不定时的对文章进行完善,就目前这些题目,不可能一天两天就看完和学完这套面试宝典,即使你已经学过了有关的技术,那么至少也需要一段时间才能消化和掌握这套面试题目,所以,大家应该早作准备,每天看一点,不断的积累, ...
转载
2021-08-02 11:08:00
237阅读
1,什么是Redis?Redis是一款开源的、高性能的键-值(key-value)数据库。Redis是Remote Dictionary Server的简称。2,Redi...
原创
2023-04-12 21:31:59
199阅读
# 自然语言处理(NLP)面试题及答案
## 什么是自然语言处理(NLP)?
自然语言处理(NLP)是计算机科学和人工智能领域的一个重要分支,旨在使计算机能够理解、解释和处理人类语言。它涉及到从文本和语音中提取意义、语法分析、机器翻译、情感分析等任务。
## NLP面试题及答案
### 1. 什么是词袋模型(Bag of Words)?
词袋模型是NLP中常用的一种文本表示方法。它将文本
原创
2023-07-31 11:56:19
362阅读
# Java面试题及答案
Java是一种广泛应用于软件开发领域的编程语言,而Java面试题也是面试中常见的考点之一。本文将介绍一些常见的Java面试题及其答案,并附带代码示例。
## 1. 面向对象的特性有哪些?
Java是一种面向对象的编程语言,它具有以下面向对象的特性:
- 封装(Encapsulation):将数据和方法封装在一起,通过访问控制符(private, protected
原创
2023-08-03 20:34:29
62阅读