热门 最新 精选 话题 上榜
Hadoop——数据压缩1、压缩概述  压缩技术能够有效减少底层存储系统(HDFS)读写字节数。压缩提高了网络带宽和磁盘空间的效率。在Hadoop下
原创 2022-05-16 09:09:56
181阅读
Hadoop——数据压缩
1、谈谈Hadoop序列化和反序列化及自定义bean对象实现序列化?1)序列化和反序列化  (1)序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议
原创 2022-05-16 09:09:48
203阅读
Hadoop面试题总结(三)——MapReduce
1、集群的最主要瓶颈  磁盘IO2、Hadoop运行模式  单机版、伪分布式模式、完全分布式模式3、Hadoop生态圈的组件并做简要描述 
原创 2022-05-16 09:09:28
89阅读
Hadoop面试题(一)
1、简述hadoop1与hadoop2 的架构异同  1)加入了yarn解决了资源调度的问题。  2)加入了对zookeeper的支持实现比较可靠的高可用。2、为什么会产生 yarn,它解决了什么问题
原创 2022-05-16 09:09:18
333阅读
Hadoop面试题(四)——YARN
1、MapReduce跑得慢的原因?(☆☆☆☆☆)Mapreduce 程序效率的瓶颈在于两点:1)计算机性能  CPU、内存、磁盘健康、网络2)I/O 操作优化 
原创 2022-05-16 09:09:05
132阅读
Hadoop面试题总结(五)——优化问题
1、停掉所有进程(NameNode和DataNode所有进程)2、删除每台机器hadoop-3.1.3下的data和logs3、在NameNode配置机器上格式化:hdfs namenode -format4、重新启动集群
原创 2022-05-16 09:07:35
285阅读
介绍下Hadoop
原创 2022-05-16 09:07:30
122阅读
大数据面试题:介绍下Hadoop
我们在项目中,经常需要监测日志文件是否出现错误异常信息,当出现错误时最好可以及时通知我们工程师,第一时间进行处理,减少系统故障时间本文介绍下日志监测分析工具WGCLOUDWGCOUD是一款免费开源的运维监控工具,...
原创 2022-05-16 09:07:07
335阅读
2点赞
项目中常用的日志文件监测分析工具——WGCLOUD
说到 WebFlux 就要提到和对比 Servlet,这样也是为了保留和尽量靠近以前代码的实现逻辑,所以最常用的就是对请求
原创 2022-05-15 21:17:14
1590阅读
搭建背景 公司内网环境,无法联网 多台机器需要安装依赖 开始搭建 1.下载安装包pip2pi 2.创建镜像源位置 mkdir /data/pip3_source 3.将需要的依赖包上传至上述目录下 4.建立依赖包索引 dir2...
原创 2022-05-15 21:12:34
1470阅读
Leetcode2011.执行操作后的变量值(https://leetcode.cn/problems/finalvalueofvariableafterperformingoperations/)cvoidfunc(constchararr,intret){//判断是+还是for(inti=0;i<3;i){if((arr+i)'+'){ret=ret+1;break;}elseif((arr+
i++
原创 2022-05-15 21:05:01
355阅读
2点赞
指尖人生
【异周话题 第 19 期】有没有必要花费大量精力深入学习CSS?话题背景从理论上来说,学习一门技术或者一门语言,必定是研究越深入、越精通,以后
原创 2022-05-15 21:01:16
189阅读
【异周话题 第 19 期】有没有必要花费大量精力深入学习CSS?
只说了一句话,产品经理乖乖由我摆布《打工人的那些事》文章目录故事开始了技术方案协商发布时间我思故我在加班
最近面试的小伙伴很多,对此整理了一份Java面试题手册:基础知识、Java集合/泛型面试题、Java异常面试题
原创 2022-05-15 13:27:04
313阅读
【2022最新版】Java基础面试题总结(70道题含答案解析)
漏洞背景和描述2022年5月11日,微软发布5月份安全补丁更新,其中CVE-2022-26923漏洞引起了人们的注意,这是一个域内权限提升漏洞,
原创 2022-05-15 13:23:58
115阅读
CVE-2022-26923域内最新权限提升漏洞
这个实战例子是构建一个大规模的异步新闻爬虫,但要分几步走,从简单到复杂,循序渐进的来构建这个 Python 爬虫。要抓
原创 2022-05-15 13:19:27
10000+阅读
01-大规模异步新闻爬虫:简单的新闻爬虫
事件委托事件委托(也叫事件代理)利用了事件冒泡,把监听函数绑定在父容器上。在触发DOM上的某个事件时,会产生一个事件对
原创 2022-05-15 13:18:12
87阅读
原来这才是前端性能优化的正确打开姿势
4月26日是第22个世界知识产权日,今年的主题是“知识产权与青年:为更美好的未来而创新”。当天,百度发布了《百度人工智
转载 2022-05-15 12:56:36
117阅读
2022百度人工智能专利白皮书 附下载
大厂技术坚持周更精选好文前言本期将用vue3与pixijs复刻出童年在小霸王里面玩的游戏-猎鸭季节,当初玩它需要光
转载 2022-05-14 19:56:39
202阅读
用vue3+pixijs复刻童年记忆里的游戏-猎鸭
为解决每次区块链连接地址变动时,都必须修改程序内或者程序内附带的连接IP地址故实现本地hosts文件IP与域名的映射实现方式:
原创 2022-05-14 19:55:57
2906阅读
前言Redis 官方在 2020 年 5 月正式推出 6.0 版本,提供很多振奋人心的新特性,所以备受关注。一键获取Redis合集资料
原创 2022-05-14 19:52:58
171阅读
「JAVA知识每日一问」:Redis6.0为什么引入多线程?
分享工作、学习中,你遇到的宝贝网站
<?php$b=0;fscanf(STDIN, "%d", $a);while($a!=1){ if($a%2==0) { $a/=2; } e
php
原创 2022-05-14 19:46:41
60阅读
用php写算法题(1001 害死人不偿命的(3n+1)猜想)
游览器输入这个地址,看到的ip就是你出去的ip
原创 2022-05-14 19:40:53
726阅读
查看局域网出口ip
导读:韩国央行在2008年发表了一个报告,叫《日本企业长寿的秘密及启示》。在这个报告中认为,全球超过200年以上的企业家
转载 2022-05-14 19:32:57
127阅读
日本百年企业传承的三个秘诀
微信关注公众号 “DLGG创客DIY”设为“星标”,重磅干货,第一时间送达。最近有块SSD(SATA接口硬盘)有问题,
原创 2022-05-14 19:15:31
198阅读
【笔记】有问题SSD安装windows系统
一、自定义拦截器 ### 自定义拦截器 ~~~ 前面 Flume Agent 的配置使用了本地时间,可能导致数据存放的路径不正确。 ~~~ 要解决以上问题需要使用自定义拦截器。 ~~~ agent用于测试自定义拦截器。netcat source =>logger sink ### 创建自定义拦截器F
原创 2022-05-14 18:33:58
70阅读
|NO.Z.00013|——————————|BigDataEnd|——|Hadoop&PB级数仓.V05|——|PB数仓.v05|会员活跃度分析|自定义拦截器实现&测试|
一、采集启动日志(使用自定义拦截器) ### 定义配置文件 [root@hadoop02 ~]# vim /data/yanqidw/conf/flume-log2hdfs2.conf a1.sources = r1 a1.sinks = k1 a1.channels = c1 # taildir
原创 2022-05-14 18:33:42
117阅读
一、ODS建表和数据加载 ### ODS建表和数据加载 ~~~ ODS层的数据与源数据的格式基本相同。 二、创建ODS层表: ### 创建ODS层表 [root@hadoop02 ~]# hive ~~~ # 建表语句 use ODS; drop table if exists ods.ods_st
原创 2022-05-14 18:33:30
114阅读
|NO.Z.00017|——————————|BigDataEnd|——|Hadoop&PB级数仓.V01|——|PB数仓.v01|会员活跃度分析|数据处理&ODS建表&加载数据|
一、采集启动日志和事件日志 ### 采集启动日志和事件日志 ~~~ 本系统中要采集两种日志:启动日志、事件日志,不同的日志放置在不同的目录下。 ~
原创 2022-05-14 18:33:18
93阅读
|NO.Z.00015|——————————|BigDataEnd|——|Hadoop&PB级数仓.V07|——|PB数仓.v07|会员活跃度分析|自定义拦截器实现&测试|