进入到eclipse界面第一步:file->new->java project->起名->finish第二步:进入到刚才建的工程里,右键src->new->package->起名->finish第三步:进入到刚才建的package里,右键name->new->class->起名(这里起名要注意,因为比赛时如果交java代码,这里的            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-29 14:15:01
                            
                                76阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            面试题)1.我们能将 int 强制转换为 byte 类型的变量吗?如果该值大于 byte 类型的范围,将会出现什么现象?2.Java语言中使用哪两个类封装大数据类型?分别有什么作用?3.&和&&的区别?4. 队列和栈是什么,列出它们的区别?5.continue和 break有什么区别?6.String与StringBuilder的区别?7.说出几点 Java 中使用 Co            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-22 17:13:44
                            
                                120阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            大数据SQL面试题本套SQL题的答案是由许多小伙伴共同贡献的,1+1的力量是远远大于2的,有不少题目都采用了非常巧妙的解法,也有不少题目有多种解法。本套大数据SQL题不仅题目丰富多样,答案更是精彩绝伦!注:以下参考答案都经过简单数据场景进行测试通过,但并未测试其他复杂情况。本文档的SQL主要使用Hive SQL。#一、行列转换描述:表中记录了各年份各部门的平均绩效考核成绩。 表名:t1 表结构:a            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-11 21:46:21
                            
                                141阅读
                            
                                                                             
                 
                
                             
         
            
            
            
             文章目录前言一、考察SQL能力*初级*1. 表A只有一个字段ID,值为[1,2,2,3,3,3]。现要求查询出重复的id2.表A又两个字段ID和Create_Time,计算今天新增的ID表[不包含昨天的那一部分];3. 表A和表B都只有一个字段Account,如果account来自A则输出red,来自B则输出blue;4. 计算字符串'ABCABC' 中字符A的个数*高级*5. 表A有两个字段I            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-07 15:39:09
                            
                                71阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1. apm系统:a. druid.io:时序数据库;b. hbase(phoenix查询):⾮关系型分布式数据库;2. ⽤户⾏为分析系统:a. hive:基于hadoop的数据仓库⼯具;            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-07-06 16:01:18
                            
                                254阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            ## Java大数据面试题
### 一、背景介绍
在当今的信息时代,数据量呈现爆炸式增长,这就诞生了大数据技术。大数据技术主要用于处理、存储和分析海量数据。而Java作为一种广泛应用的编程语言,在大数据领域也有着重要的地位。本文将介绍一些涉及Java大数据面试题,并通过代码示例来解析这些问题。
### 二、Java大数据面试题
#### 1. 什么是大数据?
大数据是指数据量巨大、处理速            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-09-08 11:53:30
                            
                                124阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # Java 大数据面试题解析
在大数据领域,Java 是一种广泛使用的编程语言,特别是在处理大规模数据集和分布式计算时。面试中,考官通常关注候选人在 Java 编程和大数据处理方面的能力。本文将介绍一些常见的 Java 大数据面试题,并通过代码示例来解析。
## 1. 常见面试题
### 1.1. Java 集合框架
**问题**:请描述 Java 集合框架的主要接口及其实现类,并举例说            
                
         
            
            
            
            1、Kafka 都有哪些特点?高吞吐量、低延迟:kafka每秒可以处理几十万条消息,它的延迟最低只有几毫秒,每个topic可以分多个partition, consumer group 对partition进行consume操作。可扩展性:kafka集群支持热扩展持久性、可靠性:消息被持久化到本地磁盘,并且支持数据备份防止数据丢失容错性:允许集群中节点失败(若副本数量为n,则允许n            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                            精选
                                                        
                            2022-09-11 18:11:43
                            
                                1014阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1. apm系统:a. druid.io:时序数据库;b. hbase(phoenix查询):⾮关系型分布式数据库;2. ⽤户⾏为分析系统:a. hive:基于hadoop的数据仓库⼯具;b. impala:基于hive的⼤数据实时分析引擎。3. HBase如何实现模糊查询?HTable table = new HTable(conf, tablename);Scan s = new Scan();  //查询rowkey包括xx的⾏Filter filter = new RowFilte            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-03-21 17:35:38
                            
                                187阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Linux部分 ①列举你使用的常用指令? ②怎么查看服务是否开启?后面的参数都是什么意思? ③怎么查看服务器内存使用情况? ④日志查看指令? ⑤跨机房怎么传输文件? Hadoop部分 ①怎么搭建一个Hadoop集群? ②Hadoop的Shuffer机制? ③切片概念?文件256M时,几个切片? ④M            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-07-20 09:29:34
                            
                                302阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            转载自: https://tieba.baidu.com/p/5524551174?red_tag=2452717583(花时间思考一下吧!)公司A:1.讲讲你做的过的项目。 项目里有哪些 难点重点注意点呢?2.讲讲多线程吧, 要是你,你怎么实现一个线程池呢?3.讲一下Mapreduce或者hdfs的原理和机            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-05-11 12:39:27
                            
                                80阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            大数据面试题下列哪个程序通常与 NameNode 在一个节点启动?答案D A)SecondaryNameNode B)DataNode C)TaskTracker D)Jobtracker 解析:hadoop的集群是基于master/slave模式,namenode和jobtracker属于master,datanode和tasktracker属于slave,master只有一个,...            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-07-08 14:34:11
                            
                                323阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            1、给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-11 09:31:12
                            
                                376阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            大数据面试题下列哪个程序通常与 NameNode 在一个节点启动?答案D A)SecondaryNameNode B)DataNode C)TaskTracker D)Jobtracker 解析:hadoop的集群是基于master/slave模式,namenode和jobtracker属于master,datanode和tasktracker属于slave,master只有一个,...            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-01-28 14:23:01
                            
                                289阅读
                            
                                                                             
                 
                
                             
         
            
            
            
             1. 选择开发语言的背后意向初学者经常会问:“陈老师,做java有没有前途?”“我在学校做过几个web小项目,听说做后台比较有前途,我要不要直接找个java的工作?”“现在Python火,工资比较高,我要不要学Python?”... ...初学者和毕业生问这些问题,是真的在问选择开发语言这件事吗?这样问比较冠冕堂皇,可以显示出谦虚、好学、关心前途的优良品质。这些都是表面的现象,他真正问            
                
         
            
            
            
             
版本
时间
描述
V1.0
2020-12-18
创建
V1.2
2021-01-17
新增 spark 面试题
V1.3
2021-01-18
新增  kafka  面试题
V1.4
2021-01-20
新增 hbase 面试题
V1.5
2021-01-30
新增  flink  面试题
 
 
目录
 
Hadoo            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2021-07-28 06:42:57
                            
                                623阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            未来10年将是大数据,人工智能爆发的时代,到时将会有大量的企业需要借助大数据,而Java最大的优势就是它在大数据领域的地位,目前很多的大数据架构都是通过Java来完成的。你的Java内功如何呢?一起来做做Java大数据方向的面试题~~ 
   
     
   1、Collection 和 Collections的区别。  
     
   
   Collecti            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-10 21:13:19
                            
                                91阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            面试官最爱问的Kakfa,基础+进阶+高级,疯狂轰炸!Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。 对于像Hadoop的一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方案            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-22 17:06:09
                            
                                49阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            HDFS基础HDFS 中的block 默认保存几份?(A)A.3 份B.2 份C.1 份D.不确定HDFS 默认BlockSize 是(C)A. 2MB            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-12-28 15:18:41
                            
                                381阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1、Spark中的HashShufle的有哪些不足? 1)shuffle产生海量的小文件在磁盘上,此时会产生大量耗时的、低效的IO操作; 2)容易导致内存不够用,由于内存需要保存海量的文件操作句柄和临时缓存信息            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-05-16 09:15:18
                            
                                579阅读
                            
                                                                             
                 
                
                                
                    