首先了解主要的系统数据库:系统数据库master包含登录信息和其他数据库的核心信息msdb 存储作业、操作员、警报、备份还原历史。数据库邮件信息等等。model 所有新数据库的模型,如果希望新数据库都有某些对象,可以在这里创建。tempdbsql server重启时重建,所以
转载 2012-05-08 23:49:00
114阅读
2评论
一、为什么还需要备份        HAWQ作为一个数据库管理系统,备份与恢复是其必备功能之一。HAWQ的用户数据存储在HDFS上,系统表存储在master节点主机本地。HDFS上的每个数据块缺省自带三份副本,而且一个数据块的三份副本不会存储在同一个DataNode上,因此一个DataNode节点失效不会造成数据丢失。而配置了HDFS NameNode HA
1.用EXISTS代替DISTINCT,消除sort operation  2.如果在GROUP BY中过滤数据,在WHERE从句中指定条件比在HAVING从句中有更好的性能,因为在GROUP之前已经过滤掉数据,因此更少的行被汇总  3.UNION会对两个SELECT语句的结果集执行一个SORT,并消除重复行,成本会昂贵,而UNION ALL则不会。因此如果应用能够处理重复,或者确信没有重复记录,...
转载 2009-09-21 15:32:00
127阅读
2评论
# Spark SQL最佳实践 Spark SQL是Apache Spark提供的用于处理结构化数据的高级功能模块。它允许用户使用SQL语句查询数据,还支持DataFrame和Dataset API。在实际应用中,我们可以通过一些最佳实践来提高Spark SQL的性能和效率。 ## 1. 使用Parquet文件格式 Parquet是一种列式存储格式,它有助于提高查询性能和压缩数据。在使用Sp
原创 4月前
14阅读
摘要 本期月报是SQL Server数据库备份技术系列文章的开篇,介绍三种常见的SQL Server备份方法的工作方式、使用T-SQL语句和使用SSMS IDE创建备份集三个层面,介绍SQL Server的三种常见备份的工作原理和使用方法。三种常见的备份包括: 摘要 本期月报是SQL Server数
原创 2022-01-20 17:07:15
504阅读
前言 ​ 内容分发网络(Content Delivery Network,CDN),是在现有 Internet 中增加的一层新的网络架构**,可以有效降低用户访问延迟,提升可用性。** CDN 按照小时粒度对全网访问日志进行打包,默认存储 30 天访问数据。COS 轻应用 -- CDN 日志备份,则 ...
转载 2021-10-22 11:02:00
88阅读
2评论
lt_dump采用的是ddl和数据分开的方式导出(虽然数据也支持insert模式,但
原创 2022-12-10 15:22:40
182阅读
没有完成hadoop 3台虚拟机集群搭建的可以先看以下两篇博客hadoop学习——伪分布式环境搭建(有安装包 非常详细)hadoop学习——完全分布式集群环境搭建(有完整的文件配置步骤)友情提醒:搭建好HA环境后 不要强制关机 否则下次就启动进程不正常了 先使用:stop-all.sh再关机!!! hadoop高可用集群环境搭建1、ntp时间同步设置2、zokeeper安装配置3、hadoop相关
转载 2023-09-18 13:09:57
162阅读
1. 使用 with 语句写多个SQL语句 2. 使用 begin with 语句写多个SQL语句 3. 提取某daily history表中最新的 image date的数据,进行计算 使用**declare** 函数进行声明后,在 where 语句中用 unnest 函数 declare max ...
转载 2021-10-09 22:06:00
863阅读
2评论
备份Kubernetes的5个最佳实践
转载 2021-02-23 09:20:00
76阅读
备份应用程序和数据是组织经常需要处理的事情。尽管Kubernetes可以确保应用程序服务的高可用性和可伸缩性,但这些好处并不能有效地保护数据。因此,必须对Kubernetes应用程序进行数据管理和备份,并应将其纳入标准操作流程中。但是,备份Kubernetes应用程序需要一种独特的方法,该方法与传统的备份解决方案大不相同。使用Kubernetes,经常会将应用程序部署在集群中跨节点的多个容器中,要
转载 2021-04-20 15:37:40
96阅读
点击上方 "编程技术圈"关注,星标或置顶一起成长后台回复“大礼包”有惊喜礼包!每日英文No matter how far, also can come to an end...
转载 2021-06-04 16:58:11
90阅读
之前碰到的《MySQL误删除文件场景》提到的问题,就是"裸奔"无备份导致的,我们一直强调数据库、应用系统都需要进行适当用程序...
转载 8月前
14阅读
随着企业和应用程序越来越依赖 MySQL 数据库来管理其关键数据,确保数据可靠性和可用性变得至关重要。在这个数字信
原创 5月前
26阅读
lt_dump采用的是ddl和数据分开的方式导出(虽然数据也支持insert模式,但默认是copy模式,性能最佳,压缩率最高),支持串行和并行导出,并行的时候按照对象级级并发(所以采用lightdb部署模式会非常快,资源可以用完)。 如下: [zjh@hs-10-20-30-193 lt_dump_
原创 2022-05-03 11:45:40
273阅读
如何迁移NameNode的元数据。
原创 2022-10-04 13:45:45
508阅读
三、HDFS高可靠性措施1)冗余备份数据存储在这些 HDFS 中的节点上,为了防止因为某个节点宕机而导致数据丢失,HDFS 对数据进行冗余备份,至于具体冗余多少个副本,在 dfs.replication 中配置。2)跨机架副本存放仅仅对数据进行冗余备份还不够,假设所有的备份都在一个节点上,那么该节点宕机后,数据一样会丢失, 因此 HDFS 要有一个好的副本存
转载 2023-09-20 10:41:21
199阅读
Byte-Pair-Encoding是用于解决未登录词的一种方法。首先简单提一句什么是未登录词,未登录词可以理解为训练语料库中没有出现的,但是在测试语料库中出现的词。我们在处理NLP任务时,通常会根据语料生成一个词典,把语料中词频大于某个阈值的词放入词典中,而低于该阈值的词统统编码成"#UNK"。这种处理方法的好处是简单,但是问题也很大,在测试语料库中如果出现了未登录词,那么我们的模型很难处理这种
最佳实践1.要实现构建过程的可定制性,Ant特征是关键。请尽可能地使用它们。2.请记住,特征值几乎总是不可变的。谁来定义它?先下手为强。3.使用<property location="..." />定义文件和目录。使用value属性定义其他字符串类型的值,需要的话可以包括文件名片段4.重用已定义的Datatype。对于路径和文件集你应该只声明一次。5.在构建中巧用...
原创 2023-04-19 03:18:27
126阅读
并发处理 – EBS并发管理器最佳实践方法参考文档:Note 1057802.1:Concurrent Processing - Best Practices for Performance for Concurrent Managers in E-Business SuiteNote 1304305.1:Concurrent Processing - Product Information Ce
  • 1
  • 2
  • 3
  • 4
  • 5