江南独孤客的博客_大数据篇,数据库篇,Linux

按发布时间
按阅读量
2023年04月 7篇

全部618篇
2024年15篇 08月1篇 07月1篇 06月2篇 05月1篇 04月1篇 03月4篇 02月2篇 01月3篇 2023年50篇 12月3篇 11月6篇 10月3篇 09月2篇 08月4篇 07月5篇 06月1篇 04月7篇 03月4篇 02月10篇 01月5篇 2022年300篇 12月2篇 11月11篇 10月20篇 09月10篇 08月3篇 07月16篇 06月26篇 05月51篇 04月64篇 03月27篇 02月48篇 01月22篇 2021年253篇 12月37篇 11月18篇 10月31篇 09月66篇 08月53篇 07月21篇 06月25篇 05月2篇
推荐/精选
全部

全部原创转载翻译

调度平台找不到CDH的Spark客户端

一.背景:因为公司使用的调度平台是没有加入到CDH集群,所以只复制了/opt/cdh下的所有文件到调度平台的work节点,公司的平台一直使用的是MR引擎为调度,上周接到一个项目,必须跑spark,调度平台执行了以后报错找不到hive on spark找不到spark的客户端.FAILED: Execution Error,return code 30041 from org.apache.hado

spark

客户端

hive

置顶原创 2023-04-20 23:11:25 146 阅读

Starrocks在建查hive外表时报EOFException: End of file reached before reading fully

1.在Hive外表时没有报错,但是把hive外表的数据插入到Starrcoks内表时报错如下: [Err] 1064 - HdfsOrcScanner.:do open failed. reason = Failed to read 0.error=Error(255): Unknown error 255, root cause=EOFException: End of f

hive

数据

建表

置顶原创 2023-04-15 08:29:05 1218 阅读

HiveServer2加载UDF函数不释放的处理

一. 故障原因:同事晚上收到服务器告警,其中OS磁盘被占用到85%(500G),查找整个OS盘下的文件占用量也没有找到占用几十几百G的大文件,其中先找到了十几个5G多的文件清理掉后,解决磁盘告警的问题,第二天同事反馈到我这里,让我排查一下原因.二.排查思路1.inode小文件,查看存在的并不多2.查看删除未释放的文件,发现有非常多调度系统中的UDF函数调用的未释放(大约有6W多)losf | gr

hive

重启

解决方案

置顶原创精选 2023-04-11 20:58:14 743 阅读

HDFS中的数据迁移到阿里云的OSS脚本

#!/bin/bash oss_size1=`hdfs dfs -du -s oss://dbbigdatapro/group/user/tools/meta/hive-temp-table/test_dbjs_home_nav/${date_desc} | awk '{print $1}'` if [[ oss_size1 -gt 0 ]] then echo "${date_desc}数据已

数据

hive

hdfs

置顶原创 2023-04-11 21:44:06 264 阅读

CDH集群之间迁移hive数据脚本

#!/bin/bash #set -x DB=$1 #获取hive表定义 ret=$(hive -e 'use ${DB};show tables;'|grep -v _es|grep -v _hb|grep -v importinfo) for tem in $ret; do hive -e "use ${DB};show create table $tem" >> /t

hive

hadoop

hdfs

置顶原创 2023-04-09 17:11:27 335 阅读 1点赞

生产环境CDH集群主机加内存导致系统无法启动,重装系统后CDH数据修复的过程

原因:因为主机扩容内存重启以后发现有七台服务器无法进入系统,重启之前Centos7的启动项被修改过导致无法重启,只能重新安装操作系统,但是HDFS的数据是保存到data盘中.系统OS:CentOS Linux release 7.6.1810 (Core) CDH版本:6.2.1 重新安装操作系统的服务器 10.170.12.43 db-pro-datanode-12-43 10.170.12

hdfs

重启

服务器

置顶原创 2023-04-09 14:59:36 535 阅读

Starrocks的知识

Starrocks是什么，它与其他OLAP数据库的区别是什么？Starrocks是一种分布式列式存储的MPP（Massively Parallel Processing）OLAP数据库，能够支持PB级别的数据存储和查询。与传统的基于Hadoop的OLAP系统相比，Starrocks具有以下几点优势：灵活的存储格式：Starrocks使用列式存储，可以根据数据特点和查询需求进行灵活的存储格式选择，从

数据

Hive

高可用性

置顶原创精选 2023-04-03 22:14:03 5492 阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

调度平台找不到CDH的Spark客户端

Starrocks在建查hive外表时报EOFException: End of file reached before reading fully

HiveServer2加载UDF函数不释放的处理

HDFS中的数据迁移到阿里云的OSS脚本

CDH集群之间迁移hive数据脚本

生产环境CDH集群主机加内存导致系统无法启动,重装系统后CDH数据修复的过程

Starrocks的知识