背景:项目中,领导要求定时将生产集群的数据导入到测试集群中,以便于数据开发人员进行开发,其次也能起到一个备份的作用;我们调研了一下,觉得distcp应该是集群同步最快的方式了,因而决定用distcp 命令来进行集群间的文件拷贝,但文件导过去后,因为都是orc表,虽然文件导过去了,但是数据依然不可使用;所以决定一不做二不休,直接将元数据也一把干过去;集群环境:TDH6.0.2 我们准备分两
-----------------------------------------------------正式工作------------------------------------------------------安装软件:VMware workstation 8Ubuntu 10.04LTS总体步骤:1.安装Ubuntu,在Ubuntu中装好jdk,hadoop和ssh-server。2
java的结构本身比较复杂,此处只对hadoop经常会遇到的知识点做一些整理,阅读此文章需要一定的java基础。Ø java多线程增强.1.      java多线程基本知识.1.1.    进程介绍     不管是我们开发的应用程序,还是我们运行的其他的应用程序,都需要先把程序
TDH架构是一种用于构建大规模分布式系统的架构模式,它包括三个关键组件:数据存储、计算引擎和数据服务。在这篇文章中,我将向你介绍如何实现TDH架构,并提供每个步骤所需的代码和解释。 ### TDH架构实现流程 下表展示了实现TDH架构的步骤及其顺序: | 步骤 | 描述 | | --- | --- | | 步骤一 | 数据存储 | | 步骤二 | 计算引擎 | | 步骤三 | 数据服务 |
原创 7月前
32阅读
星环科技作为国内出色的基础软件厂商,致力于围绕数据全生命周期为企业提供基础软件及支持。Transwarp Data Hub(后文统称TDH)是星环科技自主研发的企业级一站式多模型数据管理平台。凭借星环科技创新的技术架构和深厚的产品研发能力,自诞生以来,TDH平台帮助数千家企业实现了对海量数据的统一管理与集群服务的统一运维。通过构建业内极具特色的计算引擎与创新的系统架构持续为用户智能化管理以及开发数
星环TDH产品详解一、简介1.1 Transwarp Dta Hub介绍二、环境要求2.1 硬件环境要求2.1.1 服务器的RAID配置三、安装前的检查3.1 系统磁盘分区要求3.1.1 Redhat/CentOS3.1.2 SUSE3.2 磁盘目录规划要求3.3 内存容量要求3.4 网络设置3.5 集群和网络拓扑要求3.6 NTP服务设置3.7 安全设置3.8 系统的推荐设置四、TDH服务的角
日前,我们在2022春季新品发布会上正式推出了星环家族的一个新成员-企业级一站式大数据基础平台TDH社区版。社区版极大程度的降低了用户接触使用大数据技术的使用门槛以及使用成本,致力于为企业用户、高校师生、科研机构以及其他专业开发人员提供更轻量、更简单、更易用的数据分析开发环境。为了满足更多用户的需求,TDH社区版此次将分为订阅和免费两种模式。社区版充分依托了商业版的核心技术优势,用户可以轻松实现海
New Feature Inceptor[WARP-7124] - [ODBC] "一次绑定,多次执行" TDH 4.6 以后版本中的 ODBC 仅需绑定一次参数,就可以多次执行语句,简化了编写任务。[WARP-6982] - Holodesk GlobalIndex 为 Holodesk 新增了 GlobalIndex 特性。 [WARP-6899] - 图检索 TDH 4.6 推出了图检索功能
原创 2021-05-14 09:08:47
527阅读
过去十年间,全世界的数据量每两年大约增加10倍,已经远远超过计算领域的摩尔定律,因此人们需要有更高效的方式来处理数据。在如此强烈的需求推动下,大数据技术发展日新月异。作为摩尔定律坚定的践行者,星环科技一直致力于实现大数据技术领域的摩尔定律:近日,星环科技正式发布TDH 4.6版本,实现6个月内单位性能提升60%,并发布了一系列新产品组件,进一步降低了大数据技术从概念到落地的复杂度。此次TDH 4.
原创 2021-05-14 09:09:18
456阅读
原创 2022-06-14 22:37:21
54阅读
TDH建表语句汇总TEXT表TEXT表是文本格式的表,是Inceptor默认的表格式。在数据量大的情况
原创 2022-07-18 15:10:15
167阅读
TDH_Socket开源啦源码地址:https://github.com/taobao/TDH_Socket同时还开源了Java客户端:https://github.com/taobao/tdhs-java-client现在介绍一下TDH_Socket:TDH_Socket是一个MySQLdaemonplugin类似于HandlerSocket(https://github.com/DeNADev
原创 2012-05-16 17:12:00
689阅读
许庆伟一、eBPF 安全可观测性的前景展望从下图可以看到,监控只是可观测性的冰山一角,而大部分都隐藏在水面之下的深层次问题无法简单通过监控解决。监控(Monitoring) vs 可观测性(Observability)目前监控也开始可视化,但绝大部分都是事先预定义参数,然后事后查看日志,进行分析。监控的缺点包括:1)可扩展性差,需要修改代码和编译;验证周期长;数据来源窄等问题。2)可观测性是通过主
# 实现“星环 tdh 安装 spark”教程 ## 1. 流程图 ```mermaid erDiagram 确定环境需求 --> 下载星环 tdh --> 安装星环 tdh --> 安装 spark --> 配置 spark ``` ## 2. 任务步骤 | 步骤 | 内容 | | ---- | ---- | | 1 | 确定环境需求 | | 2 | 下载星环 tdh | | 3
原创 3月前
49阅读
从oracle导出数据为文本格式https://github.com/reader-sword/oracle-transform
原创 2022-07-18 14:49:36
70阅读
j
原创 2022-07-18 15:18:38
48阅读
1.kafka开通krb认证之后,需要在消费kafka时候加载配置文件 ./kafka-topics.sh --zookeeper 198.28.1.81:2181 --create --topic hs_user_useroperlog --partitions 3 --replication-f
原创 2022-06-14 22:49:29
252阅读
分布式事务一直是微服务等分布式系统不得不面对的难题。目前主流的解决方案有以下几种。基于阿里巴巴开源的seata AT模式分布式事务框架TCC 三段式提交事务方案(业界一般使用ByteTCC框架)基于RocketMq 消息中间件实现最终一致性事务下面基于这三种方式进行原理剖析对比选型以及各自的优缺点比较一、SeataTC:事务协调器。控制全局事务的开启,提交回滚。TM:事务管理器,负责定义事务的边界
3 PLSQL调优3.1 表的优化3.1.1 表类型的优化文本表主要在数据的导入导出中作为过度表使
原创 2022-07-18 15:10:26
125阅读
原创 2022-06-14 22:37:46
129阅读
  • 1
  • 2
  • 3
  • 4
  • 5