一、Hive架构设计 1.1.Hive架构设计 由上图可知,Hive全局架构图中可以看到Hive架构包括如下组件:CLI(command line interfac
一、Explain 1.1.功能 HiveQL是一种类SQL的语言,从编程语言规范来说是一种声明式语言,用户会根据查询需求提交声明式的H
一、Hive文件格式 Hive数据存储的本质还是HDFS,所有的数据读写都基于HDFS的文件来实现,为了提高对HDFS文件读写的性能,Hi
一、zookeeper概述 ZooKeeper概念: Zookeeper是一个分布式协调服务的开源框架。本质上是一个分布式的小文件存储系统ZooKeeper作用:
一、Kettle简介 Kettle(又名:Pentaho Data Integration)是一款国外开源的ETL工具。 Kettle 中文名称叫水壶,该项目的主程序
一、ETL概念及实现方式 ETL(Extract, Transform, Load)是数据集成的核心过程,用于从不同的数据源中提取数据,对其进行清洗和转换,最
一、init 方法是什么? init 方法通常用在初始化一个类实例的时候。例如: class Person(object): def __init__(self, name, age, sex): self.name = name self.age = age self.sex = sex if
一、什么是存储过程和函数 存储过程是一组预先编译好的SQL语句的集合,可以理解成批处理语句 ,特点: 提高了代码的重用性 简化了
概要 地理空间数据分析在许多领域中都有着广泛的应用,包括地理信息系统(GIS)、城市规划、环境科学、地质勘探等。Pyth
一、 什么是Pandas? Pandas的名称来自于面板数据(panel data),Pandas是一个强大的分析结构化数据的
一、生成数据表 1.1.文件读取 1.1.1.导入Excel文件 首先导入pandas库,一般都会用到numpy库先导入,导入CSV或者xlsx文件: import numpy as np import pandas as pd # 读取 Excel
一、数据提取 1.1.按索引提取单行的数值 语法: # 根据索引取值 df_inner.loc[3] 案例: import pandas as pd import numpy as np # 示例数
一、NumPy是什么?有什么作用? NumPy 是一个功能强大的 Python 库,主要用于对多维数组执行计算。 NumPy 这个词来源于两个单词-- Numerical 和
一、基本的SELECT语句 预先创建表departments: CREATE TABLE departments ( DEPARTMENT_ID INT PRIMARY KEY, DEPARTMENT_NAME VARCHAR(255), MANAGER_ID INT, LOCATION_ID IN
一、为什么需要学习数据库 为了方便数据的查询: 数据库是一种结构化的数据存储方式,它能够以表格的形式存储数据,并且支持高效的查询和检索。学习数据库可以让人掌握使用SQL等查询语言的技能,能够根据特定条件快速地检索出所需的数据,提高了数据的利用价值和工作效率。 为了持久化存储数据: 数据库可以持久化地
一、字符函数 1.1.字符函数 1.2.大小写控制函数 这类函数改变字符的大小写 1.3.字符控制函数 函数控制字符: 注意: TRIM() 函数用于去除字符串首尾的空格或指定字符。 REPLACE() 函数用于替换字符串中的指定部分。 二、数学函数 函数作用 测试值 操作后值 ROUND: 四舍五
一、使用 DML 语句 DML(Data Manipulation Language 数据操纵语言) 可以在下列条件下执行: 向表中插入数据 修改现存数据 删除现存数据 事务是由完成若干项工作的DML语句组成的 二、向表中插入数据 2.1.INSERT 语句语法 使用 INSERT 语句向表中插入数
一、创建数据库 创建一个保存员工信息的数据库: #通用的写法: DROP DATABASE IF EXISTS 旧库名; CREATE DATABASE 新库名; 相关其他命令 show databases;查看当前所有数据库 use employees;“使用”一个数据库,使其作为当前数据库 数据
一、约束 1.1.什么是约束?为什么要有约束? 为了保证数据的一致性和完整性,SQL规范以约束的方式对表数据进行额外的条件限制。 约束是表级别的
一、系统变量 系统变量:指的是变量由系统定义,不是用户定义,属于服务器层面注意:全局变量需要添加global关键字,会话变量需要添加session关键字,如果不写,默认会话级别使用步骤:⑴.查看所有系统变量 show global|【session】variables; ⑵.查看满足条件的部分系统变
一、什么是窗口函数 MySQL 8.0 新增窗口函数,窗口函数又被称为开窗函数,与Oracle 窗口函数类似,属于MySQL的一大特点,窗口数是一种特殊的函数,它可以在一组查询行上执行类似于聚合的操作,但是不会将查询行折叠为单个输出行,而是为每个查询行生成一个结果。窗口函数可以用来处理复杂的报表统
一、MySQL流程控制 MySQL中的流程控制结构可分为3类如下: 顺序结构:就是按照顺序正常执行下去 分支结构:if、case等 循环结构:loop、while、repeat等 二、分支结构 2.1.IF函数 语法: IF(expr1,expr2,expr3) 执行:如果expr1成立,执行exp
一、什么是函数?函数和存储过程有什么区别? 1.1.函数 在MySQL中,函数(Function)是用来封装一系列SQL语句并返回单个值的数据库
一、视图 1.1.什么是视图? 视图:MySQL从5.0.1版本开始提供视图功能。是一张一种虚拟存在的表,行和列的数据来自定义视图的查询中使用
一、PowerBl是什么?有什么作用? Power BI 是一款数据分析工具,能够协助完成数据的采集、清洗、建模和可视化等流程。与Excel类似,Power BI也是由
一、Excel中数据类型 数据类型又称数据型态,不同的数据类型具有不同的数据表示方法、不同的数据结构和不同的取值范围等。就如同生
一、什么是一维表和二维表? 一维表和二维表是数据表格中的两种不同结构,它们在数据组织和表示上有所不同。 一维表: 一维表是指
一、Excel数据可视化 在Excel中进行数据可视化可以通过多种方式实现,以下是一些常见的方法: 图表:Excel提供了丰富的图表类型
一、Navigation组件介绍 Navigation组件一般作为页面的根容器,包括单页面、分栏和自适应三种显示模式。同时,Navigation提供
一、什么是元服务 元服务(原名为原子化服务)是HarmonyOS提供的一种面向未来的服务提供方式,是有独立入口、免安装、可为用
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号