数据学习之路一、配置idea开发环境1、下载所需文件2、安装 jdk3、安装 maven4、安装 hadoop5、idea 中设置 jdk、maven二、homework_day0310个MR案例代码练习1、wordCount2、ip去重3、分组求平均值4、 求最大最小值5、序列化机制——购物金额统计6、分区——按地区分为三个分区7、combiner——对wordCount进行combiner
转载 2024-10-30 10:15:18
32阅读
一、是什么      随着数据的日益增长,很多数据由热变冷,已经不再或者很少使用,而数据的存储需求越来越大,计算需求则相应增长不大。如何解耦这种急剧增长的存储需求和计算需求?HDFS Archival Storage正好能派上用场。      HDFS Archival Storage是Hadoop-2.6.0新增的一个特性,是Hadoo
转载 2024-03-10 20:49:04
145阅读
# Hadoop DataNode数据目录迁移 Hadoop是一个开源的分布式存储和计算框架,广泛应用于大数据处理领域。DataNode是Hadoop集群中的一个关键组件,负责存储数据块。在某些情况下,我们可能需要对DataNode的数据目录进行迁移,以满足存储扩展、硬件升级等需求。本文将介绍一种迁移方法,即在不停止Hadoop服务的情况下,平滑地迁移DataNode的数据目录。 ## 迁
原创 2024-07-29 07:18:04
57阅读
     最近为一家客户部署了NAS,用来做文件共享,并外置了一个2T的移动硬盘做备份。使用的品牌是buffalo,一个在日本非常有名,很多日企都比较喜欢的牌子。由于客户端数量不多,只有二十台不到,所以选择了TS-XL980D这个型号,4块500G硬盘做raid5,可用容量大约1400G不到,按个人和部门设置了共享文件夹及权限。  &nb
一、 导出/导入(Export/Import)利用Export可将数据数据库中提取出来,利用Import则可将提取出来的数据送回到Oracle数据库中去。1、 简单导出数据(Export)和导入数据(Import) 二、 备份备份发生在数据库已经正常关闭的情况下,当正常关闭时会提供给我们一个完整的数据库。备份时将关键性文件拷贝到另外的位置的一种说法。对于备份Oracle信息而言,
转载 2024-06-08 20:12:22
88阅读
Hadoop 高可用(HA)的自动容灾配置  参考链接    Hadoop 完全分布式安装  ZooKeeper 集群的安装部署  0. 说明  在 Hadoop 完全分布式安装 & ZooKeeper 集群的安装部署的基础之上进行 Hadoop 高可用(HA)的自动容灾配置&
转载 2023-08-03 21:34:14
91阅读
# Hadoop DataNode数据存放目录迁移指南 作为一名经验丰富的开发者,我将指导你如何实现Hadoop DataNode数据存放目录的迁移。迁移意味着在不停止Hadoop集群服务的情况下,将DataNode的数据目录迁移到新的存储位置。 ## 迁移流程概览 首先,让我们通过一个表格来了解整个迁移流程的步骤: | 步骤 | 描述 | | --- | --- | | 1 | 准
原创 2024-07-20 07:34:40
111阅读
Hadoop集群搭建  把环境全部准备好,包括编程环境。JDK安装版本要求:  强烈建议使用64位的JDK版本,这样的优势在于JVM的能够访问到的最大内存就不受限制,基于后期可能会学习到Spark技术,所以建议在搭建系统环境的时候把JDK的版本安装为64位。如果已经安装,在你不确定安装的版本情况下,可以使用如下方式查看:快捷键WIN+R,调出DOS窗口,然后输入java –version就可以了,
正文1.冷热端分离缓存的命中率受多种因素影响,其中最重要的因素之一是缓存的大小。在实际应用中,经常会遇到数据集非常大的情况,如果将全部数据都放入缓存,那么缓存的命中率就会很低,从而影响系统的性能。此时可以考虑采用冷热端分离的策略。所谓冷热端分离,就是将数据集分为两个部分:数据和热数据数据指的是访问频率低的数据,可以不用放入缓存中,而热数据指的是访问频率高的数据,应该优先放入缓存中。通过冷热端
  对于oracle数据库只有物理备份和逻辑备份  物理备份:是将实际组成数据库的操作系统文件从一处拷贝到另一处的备份过程,通常是从磁盘到磁带。  逻辑备份:是利用SQL语言从数据库中抽取数据并存于二进制文件的过程。  第一类为物理备份,该方法实现数据库的完整恢复,但数据库必须运行在归挡模式下(业务数据库在非归挡模式下运行),且需要极大的外部存储设备,例如磁带库,具体包括备份和热备份。备份和热
转载 2024-01-18 11:41:23
140阅读
HDFS体系结构   备份:发生故障以后,先停止一段时间,把一些数据从第二名称节点慢慢恢复过来,恢复过来后再提供对外服务。HDFS存储原理:冗余数据保存的问题:一个数据块会被默认保存3份(可并行操作同一数据,加快数据传输速度;很容易检查数据错误,有参照;保证数据可靠性)数据保存策略的问题:1)  2)数据读取 HDFS提供了一个API可以确定一个
转载 2023-10-09 19:50:32
335阅读
用户管理的备份:备份脚本要自己写;备份哪些文件要自己选;恢复时要复制那些文件自己判断;恢复需要的日志,自己找;备份,需要备份保存关键SCN信息的文件;一次完成的备份包括:控制文件,数据文件,日志文件。备份:一致性关闭数据库后,对文件进行备份,通过操作系统命令直接拷贝 控制文件,数据文件,日志文件。 容易实现,操作简单,但是会影响正常使用。热备份:在数据库运行时,对文件进行备份,操作起来将备份
转载 2023-11-13 15:02:51
98阅读
Hadoop是一个支持海量数据的分布式存储和分布式计算的平台    包含:        HDFS        YARN        MapReduce    分布式管理系统(HDFS)      &nbs
本文实例讲述了PHP结合Redis+MySQL实现冷热数据交换应用案例。分享给大家供大家参考,具体如下:场景:某网站需要对其项目做一个投票系统,投票项目上线后一小时之内预计有100万用户进行投票,希望用户投票完就能看到实时的投票情况这个场景可以使用redis+mysql冷热数据交换来解决。何为冷热数据交换?数据:之前使用的数据,热数据:当前使用的数据。交换:将Redis中的数据周期的存储到MyS
之前的WDBlack NVMe SSD,基本上是为了打破三星在固态存储领域牢不可破的领先地位。快进到今年年初,市场已经变得更加多样化,从Corsair, Adata,甚至希捷都有很好的选择——它几乎变得有点难以脱颖而出。WD Black SN750绝对是我们测试过的最快的固态硬盘之一。有着优惠的价格,这可能是将西部数据永久性地置于黑暗中的动力。    &nb
转载 2024-02-20 20:35:02
70阅读
关系型数据库RDBMS全称:Relational Database Management System数据的分类数据是对于离线类不经常访问的数据,比如备份数据、档案与操作日志数据、话单凭证与统计数据数据不需要实时访问到离线数据, 用于灾难恢复的备份或者因为要遵守法律规定必须保留一段时间的。热数据是需要被计算节点频繁访问的在线类数据。指即时的位置状态、交易和浏览行为。温数据是非即时的状态和行为
转载 2024-05-27 20:03:05
156阅读
点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源大数据技术与架构点击右侧关注,大数据开发领域最强公众号!大数据真好玩点击右侧关注,大数据真好玩!版权声明:本文为大数据技术与架构...
转载 2021-06-10 21:07:47
242阅读
点击上方蓝色字体,选择“设为星标”回复”资源“获取更多资源大数据技术与架构点击右侧关注,大数据开发领域最强公众号!大数据真好玩点击右侧关注,大数据真好玩!版权声明:本文为大数据技术与架构...
转载 2021-06-10 21:07:46
175阅读
在大数据环境中,Hadoop作为流行的框架之一,其数据管理尤其是备份和恢复机制显得尤为重要。在实际操作中,我们常见的备份方式有备份和热备份,其中备份指的是在系统停止运行的状态下进行的备份。这种方式可以确保数据的完整性和一致性,因此在数据敏感度要求较高的场合,备份成为了更为可靠的选择。 ## 备份策略 在进行Hadoop备份时,合理的备份策略至关重要。我采用了定期备份的方式,以确保数据
原创 7月前
57阅读
前言:我有一个西数蓝盘500G固态,系统盘,一年没开机,这个月开机后发现系统很卡,持续读取假死严重。测试没有坏块,网上说的是数据掉速问题。工具:HdTuneVictoriaSSDReadSpeedTester(精细到文件,耗时较长)DiskFresh检查固态硬盘是否存在掉速现象:1、进入PE系统或把硬盘挂载为移动硬盘。2、使用HdTune、Victoria或SSDReadSpeedTester测
  • 1
  • 2
  • 3
  • 4
  • 5