我们在上一篇文章中给大家介绍了数据分析工具的维度。一般来说,数据分析的维度有两种,第一种就是数据储存层、数据报表层、数据分析层、数据展现层。而第二维度就是用户级、部门级、企业级、商业智能级。并且在上一篇文章中给大家介绍了数据储存层,下面我们就给大家介绍一下数据分析中的报表层。一般来说,数据报表层中的数据分析工具相对数据储存层不是很多的,重要就是有fineReport以及Tableau,并且还有F
转载
2024-03-08 19:49:22
5阅读
Linux、Unix-Like平台的用户都可能会发现,du与df的查询结果会不一致。最常见的情况就是,df显示的已使用磁盘占用率比du统计出来的结果要大很多。 下面说下两者结果不同的原因,主要是由于两者计算结果的方式不同。 先来看看两者是如何计算的 df命令: 已分配空间=空间总数-未分配空间 df中的used还包含了程序申请的、被程序占用的空间等等。因为基于文件系统总体来计
python信用评分卡建模(附代码,博主录制) https://mp.weixin.qq.com/s/KefG_8krBBaFl0LCi2L2WA转载一、VintageVintage源于葡萄酒酿造,葡萄酒的品质会因葡萄生长的年份不同、气候不同而不同。Vintage分析是指评估不同年份的葡萄酒的品质随着窖藏时间的推移而发生的变化,并且窖藏一定年份后,葡萄酒的品质会趋于稳定。如下图,2000年的葡萄
转载
2024-04-28 16:47:34
0阅读
# 数据分析中的插值处理指南
在数据分析中,插值处理是一种用于在已知数据点之间估算新数据点的技术。简单来说,它可以帮助我们填补缺失的数据,以便更好地理解和利用数据。在这篇文章中,我将详细讲解插值处理的流程、所需的代码和对应的解释。
## 插值处理流程
以下是进行插值处理的主要步骤:
| 步骤 | 描述 |
|------|------|
| 1 | 收集和准备数据集 |
| 2
当我们在观测资产最终损失和不同资产的风险差异时,经常会用到一个指标,那就是Vintage。这个指标的计算和展示与大多数指标有所不同,因为所需要的数据信息并不单来源于某一个固定时间的切片数据,而是来源于历史多个时间节点的切片数据,所以它也携带了历史信息。Vintage本身携带了这么多信息,我们该如何挖掘呢?PS:全文所有内容仅参考引用自FAL-【金科应用研院】内部公号,FAL公号所有内容未经许可,不
转载
2023-11-20 10:54:05
490阅读
三、数据集介绍MNIST数据集,训练集60000张图片和标签;测试集有10000张图片和标签。读取28*28图片以后,要将每张图片转换为1*784的向量。四、KNN算法实现和结果分析代码实现:from numpy import *import operatorimport osimport numpy as npimport matplotlib.pyplot as pltfrom matplot
----------------维度--------------- 维度是观察数据的角度和对数据的描述。可以说地区是一种维度,这个维度包含上海、北京这些城市。也可以认为销售额是一个维度,里面有各类销售数据。维度可以用时间、数值表示,也可以用文本,文本常作为类别。数据分析的本质是各种维度的组合,我想了解和分析全国各地的销售额,就需要将地区维度和销售维度结合,如果想知道各个年份的变化,那么再加入时间维
转载
2023-12-14 22:19:24
253阅读
1、看数据看维度在对某一项业务或者业务的某个模块进行分析时,可以从大小两个角度去切入分析。首先站在广阔的视角去看待一些数据。比如对某个产品(消费品),就要分析在大环境下是一个什么样的数据,如市场排名,市场占有率。还要记录市场整体波动情况,竞品的数据。这些一般可以通过第三方调研机构或者行业报告获得。FineReport数据报表看板然后需要分析针对这个产品你内部关心的数据是什么。比如每月每周的销售量,
转载
2024-01-11 12:26:04
7阅读
文章目录前言01、Matplotlib、Seaborn 和 Pandas02、ggplot(2)03、Bokeh04、Plotly05、Pygal06、NetworkxPython入门教程?Python学习视频600合集??实战案例??100道Python练习题??面试刷题?资料领取 前言喜欢用 Python 做项目的小伙伴不免会遇到这种情况:做图表时,用哪种好看又实用的可视化工具包呢?今天小爱
文章目录一、变量类型——四值变量与二值变量二、固定数组——非压缩数组与压缩数组2.1.非压缩数组2.2.压缩数组三、动态数组四、队列五、联合数组六、数组方法6.1.数组运算方法6.2.数组排序方法6.3.数组定位方法七、结构体八、枚举类型九、字符串变量 一、变量类型——四值变量与二值变量变量(信号)类型分为:四值变量和二值变量;四值变量: (0、1、x、z)四种状态wire——主要用在a
插值、拟合和逼近的区别据维基百科,科学和工程问题可以通过诸如采样、实验等方法获得若干离散的数据,根据这些数据,我们往往希望得到一个连续的函数(也就是曲线)或者更加密集的离散方程与已知数据相吻合,这过程就叫做拟合。通过拟合得到的函数获得未知点的数据的方法,叫做插值。其中,拟合函数经过所有已知点的插值方法,叫做内插。 拟合是已知点列,从整体上靠近它们;插值是已知点列并且完全经过点列;逼近是已知曲线,
转载
2023-10-17 21:34:37
662阅读
一、概念介绍:1.Power Query(查询——数据处理): 一个插件,相当于Excel中的数据选项卡下的数据查询,可以弥补 Excel 的不足,处理数据的能力边界大大提升。PQ用到的语言是M语言,学习 PP 就是学习 Power BI 中的数据处理模块2.Power Pivot(透视——数据建模): 相当于Excel中的数据透视表,但是PP功能更强大。PP 用到的语言是 DAX,学习 PP 就
文章目录前言一、AP(Average Precision)1.1 TP(True Positive)、FP(False Positive)、FN(False Negative)1.2 Precision(查准率)、Recall(召回率/查全率)1.3 PR曲线1.4 mAP(mean Average Precision)二、FLOPs、FLOPS三、FPS四、MACsReference 前言目标
转载
2024-05-13 21:09:41
87阅读
数据类型是统计学中的重要概念,我们需要对它有正确的理解方能利用正确的数据类型来获得结论。
这篇文章将介绍几种用于机器学习探索性数据分析的数据类型,以便正确的把握和利用数据。
对数据结构的良好理解对于机器学习中探索性分析十分重要,对于不同的数据类型我们需要不同的统计学度量手段来进行分析测试。同时也需要根据数据的类型选择合适的可视化方式来帮助我们更好的理解数据。最后数据类型也为变量的分类提供
转载
2024-01-12 02:34:01
71阅读
# 大数据分析中的潮汐值理解与实现
在现代数据科学的世界中,“潮汐值”是一种重要的分析指标,特别是在时间序列分析与大数据环境下。本文将帮助初学者理解潮汐值,并提供实现步骤,包括代码示例和图表。
## 流程概述
为了更好地实现潮汐值的计算与分析,以下是我们将遵循的步骤:
| 步骤 | 内容 | 描述 |
分析数据之间的差异,站在理性的角度进行项目对比,是数据分析的重要思路。利用数据透视表,切换数值显示方式,可以轻松地对比数据的数值差异,以及进行同比、环比对比,从而判断项目的涨跌情况。1.分析数值差异分析数值之间的差异,可以选定一个项目为参照标准,将值显示方式调整为【差异】方式,即可看到其他项目与参照项目之间的数值差异。如下图所示,同是巧克力分类下的商品,其中“金帝巧克力”的销量比较好。现在需要分析
转载
2023-08-18 16:48:47
160阅读
大家好,我是爱学习的小xiong熊妹。 一提起数据分析,很多人都会联想到“分析模型”,似乎分析模型是个很厉害又很神秘的东西。那做数据分析到底需要懂多少模型?今天简单跟大家分享一下。 一、什么是模型模型,指的是对复杂现实的逻辑抽象。具体到数据分析上,当人们提及“模型”俩字,其实有两个含义: 第一类:业务模型。比如我们经常听的AARRR、RFM、SWOT、PEST等等。一
转载
2024-01-18 17:17:02
8阅读
数据结构基础概念、线性表、栈和队列、树和二叉树、图、查找和排序
1. 数据结构:是指相互之间存在一种或多种特定关系的数据元素的集合用计算机存储、组织数据的方式2. 数据结构分别为逻辑结构、存储(物理)结构和数据的运算三个部分3. 数据的逻辑结构是指反映数据元素之间逻辑关系的数据结构,常见如以下四种:集合结构、线性结构、树形结构、图结构
转载
2023-07-21 12:02:51
106阅读
# 数据分析中的事件分析
在数据分析领域,事件分析是一个非常重要的主题,它涉及到对特定事件的研究,以识别模式、趋势和相关性。事件分析常常用于商业、体育、医疗等多个领域,通过分析事件的发生,可以帮助决策者做出更明智的选择。
本文将介绍事件分析的基本概念,并通过代码示例来演示如何在 Python 中进行简单的事件分析。同时,我们也会用流程图和旅行图来展示这一过程。
## 事件分析的基本概念
事
多维度分析实质是细分分析,多维度分析对精细化运营的作用非常重要。多维度分析主要基于两个地方展开,一个是指标的细化,一个是维度的多元,比如时间维度,竞品维度等。管理层通常看的是综合指标,总值。但是这些总值无法真正发现问题。而运营通常需要根据具体的、细分的数据来支撑决策。比如从用户角度看,每天访问用户100万,每天购买的用户1万,但这100万个用户是通过什么渠道知道平台的,在平台哪个模块停留时间长,哪
转载
2023-10-17 22:19:30
49阅读