NeilNiu的博客_大数据_51CTO博客

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册

# 大数据

计算即时订单比例-首单使用开窗函数row_number()

计算即时订单比例-首单使用开窗函数row_number()

首先需要从数据集中拿出每个用户的首单，一般都是使用排序开窗函数进行操作。然后计算即时订单的比例，只需要从拿出，以小数形式显示。请从配送信息表（delivery_info）中求出每个用户的首单（用户的第一个订单）中即时订单的比例，保留两位小数，以小数形式显示。

hive

保留两位小数

数据集

原创 11月前 196 阅读

HDFS概述

HDFS概述

HDFS文件系统，分别是NameNode 和DataNodeHDFS的四个基本组件：HDFS Client、NameNode、DataNode、和SecondaryNameNode1、Client就是客户端文件切分，文件上传HDFS的时候，

hdfs

hadoop

大数据

HDFS

文件系统

原创 2023-04-23 12:46:45 31 阅读

大数据简介

大数据简介

大数据概论和职业规划Linux服务器系统Hadoop概论HDFS分布式文件系统Hive数据仓库SparSQL指令Zepplin框架Sqoop框

大数据

hadoop

spark

Powered by 金山文档

数据

原创 2023-04-23 12:24:49 111 阅读

Hadoop框架概论

Hadoop框架概论

集群：集群是指一组独立的计算机系统构成的一多处理器系统，它们之间通过网络实现进程间的通信，让若干台计算机联合起来工作（服务），可以是并行的，也可以是做备份的。其中重点的包括：Kafka、Spark、Flink、Hive、HBase、Zookeeper、Yarn、HDFS、MapReduce、集群模式主要用于生产环境部署，会使用N台主机组成一个Hadoo

hadoop

大数据

分布式

Hadoop

HDFS

原创 2023-04-23 12:24:47 59 阅读

数据仓库概论

数据仓库概论

数据仓库，英文名称Data Warehouse，可简写为DW和DWH，数据仓库顾名思义，是一个很大的数据存储集合，出于企业的

数据仓库

数据库

数据挖掘

数据

原创 2023-04-23 12:24:40 52 阅读

Hive概论、架构和基本操作

Hive概论、架构和基本操作

Apache Spark是一个快速的，多用途的集群计算系统，相对于Hadoop MapReduce将中间结果保存在磁盘中，Spark使用了内

hive

hadoop

大数据

Hive

数据库

原创 2023-04-23 12:24:38 64 阅读

Zeppelin框架及Hive查询操作

Zeppelin框架及Hive查询操作

Apache Zeppelin是一款基于Web交互式框架，支持多种语言，Scala、SparkSQL、Markdown，SQL、Shell、Python等。可以使用Zeppelin链接SparkSQL。Zeppelin提供数据分析、数据可视化。打开浏览器访问，xxxx:8090。Zeppelin安装和使用。一键启动集群中所有的组件

大数据

Hive

hive

数据

原创 2023-04-23 12:24:18 221 阅读

实战大数据项目

实战大数据项目

存储日志数据集（HDFS）数据仓库构建（Hive）数据分区表构建数据预处理（Spark计算引擎）-使用Zeppelin进行写SQL订单指标分

大数据

数据

mysql

预处理

原创 2023-04-23 12:24:09 829 阅读 1收藏