一提到统计学,大家估计首先想到的是一页又一页的公式,求极限,求样本量,求条件概率,求显著性p值等等。一想到这些就头疼,一想到这些就开始头疼脚痛,假装没看见想趁机溜走。还有好多人以“文科生”身份来自保,觉得文科生不了解统计学是理所当然的事情。但是其实在生活中我们已经无意间在使用一些统计学知识了。❉ 统计统计,三份统计,七分估计生活场景一:“水果摊的老板总是热情的让我们试吃,可试吃的这个是不
转载
2023-12-16 16:51:15
94阅读
pg动态游标居然直接用就可以
原创
2019-09-17 15:08:31
3050阅读
阅读之前看这里
?:博主是正在学习数据分析的一员,博客记录的是在学习过程中一些总结,也希望和大家一起进步,在记录之时,未免存在很多疏漏和不全,如有问题,还请私聊博主指正。
博客地址: 天阑之蓝的博客
,学习过程中不免有困难和迷茫,希望大家都能在这学习的过程中肯定自己,超越自己,最终创造自己。统计学的知识,学了那么多,应该在实际问题去验证和解决,尽量在实际项目中去应用,要有输出的环境,否则学习只
转载
2023-11-17 19:47:17
140阅读
1t检验 提前,满足正态性1. 1单样本t检验已知某水样中含碳酸钙的真值为20.7mg/L,现用某法重复测定该水样12次,碳酸钙的含量分别为…问该法测定碳酸钙含量所得的均值与诊治有无显著差异?12次测定中,碳酸钙的含量分别为20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.42,20.90,22.99,23.12,20.89 输入:> x <-
转载
2023-08-11 09:13:16
147阅读
大家好,描述性统计分析主要是指求一组数据的平均值、中位数、众数、极差、方差和标准差等指标,通过这些指标来发现这组数据的分布状态、数字特征等内在规律。在Python中进行描述性统计分析,可以借助Numpy、Pandas、SciPy等科学计算模块计算出指标,然后用绘图模块Matplotlib绘制出数据的分布状态和频率及频数直方图,以更直观的方式展示数据分析的结果。一、描述性统计指标计算用describ
转载
2023-06-20 17:14:21
124阅读
作者 | 俊欣今天小编来给大家讲一下Pandas模块当中的数据统计与排序,说到具体的就是value_counts()方法以及sort_values()方法。value_counts()方法,顾名思义,主要是用于计算各个类别出现的次数的,而sort_values()方法则是对数值来进行排序,当然除了这些,还有很多大家不知道的衍生的功能等待被挖掘,下面小编就带大家一个一个的说过去。导入模块并且读取数据
转载
2024-02-26 09:09:46
158阅读
以2019年北京、上海、广州三城市在居民消费支出数据为例,利用Python分析了消费结构支出情况,包括食品烟酒、衣着、居住、生活用品及服务、交通通信、教育文化娱乐、医疗保健、其他用品及服务等几方面。使用的分析形式有并列柱状图、饼状图两种。目录一、原始数据二、统计分析1、并列柱状图2、饼状图三、实现代码四、实现效果一、原始数据原始数据如表1所示,把该表转成csv格式,内容不变,文件名为“consum
转载
2023-07-07 23:04:41
286阅读
在 PostgreSQL 数据库,统计信息可以大致分为两种。一种是通常意义上规划器用于生成执行计划的关于数据分布的统计信息,还有一种是跟踪服务进程的统计信息一、数据分布统计信息1、什么是数据分布统计信息?与每张表的数据分布有关,是一种描述数据分布的统计数据。规划器使用的统计信息有两种:单列统计信息比较常见的,可以从pg_statistic表中查看某张表单个字段的统计信息扩展统计信息analyze只
转载
2023-11-02 20:03:51
412阅读
# Spark性别统计分析案例
在这篇文章中,我将教你如何利用Apache Spark进行性别统计分析。我们将通过处理一组简单的数据来展示如何统计性别分布。整个流程将分为几个步骤,每个步骤将详细描述所需的代码及其功能。
### 整体流程
下面的表格展示了我们将进行的每一步骤及其对应的描述:
| 步骤 | 描述 |
【代码】【sql】PostgreSQL物化视图表使用案例。
在 PostgreSQL 中,可以使用 unnest 函数来展开数组,然后进行聚合操作。例如,如果你有一个数组字段,想要将数组
场景假设 假设我们有两张表: sales 表:记录了每个产品的销售数量 product_id (产品ID) quantity (销售数量) products 表:
实验内容及要求利用观测数据计算总体分位数、对称中心和位置差的点估计,区间估计;利用R软件自带程序或自编程序完成中位数的符号检验,两总体比较的Wilcoxon秩和检验和K-S检验,独立性与随机性的卡方检验和Fisher列联表检验,相关性秩检验与协同性检验以及多总体比较的秩和检验和卡方检验;制作数据经验分布函数、概率密度图像,使用分布拟合方法解决总体类型的检验问题;通过最小二乘与权函数结合使用的方法解
转载
2024-01-25 21:29:20
189阅读
环境
postgresql-14
按小时统计业务
SELECT
count(1),
to_char(gmt_create, 'YYYY-MM-DD HH24' ) AS d
FROM
table_name
WHERE
gmt_create >'2023-12-13 11:30:00'
GROUP BY d
ORDER BY d
按天统计
SELECT
count(1),
to_
原创
2023-12-13 20:18:49
204阅读
系列文章目录见【Python Onramp】 0. 卷首语上一篇:【Python Onramp】1. 熟悉Python基本语法、数据结构和方法:2018年中国机场数据处理 下一篇:【Python Onramp】3. Python的文本分析(1)jieba分词:第三方库和基本面向对象编程 本文目录系列文章目录项目描述任务的可视化示例Task 1Task 2Task 3Task 4语法总览语法点1:词
1.多维度统计PV总量1.时间维度--计算指定的某个小时pvsselect count(*),month,day,hour from dw_click.ods_weblog_detail group by month,day,hour;--计算该处理批次(一天)中的各小时pvsdrop table dw_pvs_hour;create table dw_pvs_hour(month...
原创
2021-07-07 11:26:29
346阅读
Part1 描述统计描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。集中趋势分析集中趋势分析主要靠平均数、中数、众数等统计指标来表示数据的集中趋势。例如被试的平均成绩多少?是正偏分布还是负偏分布?离中趋势分析离中趋势分析主要靠全距、四分差、平均差、方差(协方差:用来
转载
2024-01-11 14:25:13
156阅读
1.多维度统计PV总量1.时间维度--计算指定的某个小时pvsselect count(*),month,day,hour from dw_click.ods_weblog_detail group by month,day,hour;--计算该处理批次(一天)中的各小时pvsdrop table dw_pvs_hour;create table dw_pvs_hour(month...
原创
2022-03-24 09:57:35
364阅读
R语言学习之数据分析实战(一)一、线性回归回归(regression):通常指那些用一个或多个预测变量,也称自变量或解释变量,来预测响应变量,也称为因变量、效标变量或结果变量的方法。普通最小二乘回归法(OLS)以women数据集为例:lm()函数formula:需要拟合的形式,y~xdata:需要使用的数据集,数据框的形式R表达式中常用的符号使用lm()函数对women数据集进行回归分析>
转载
2023-05-24 14:32:50
177阅读
数据集:所有属性独立的、均等的对最终结果做出贡献。(这是不现实的,现实的数据集属性并不同等重要,也不彼此独立。只是通过假设,引出一个简单的方案,并在实际中表现极佳。)
方法:朴素贝叶斯方法。
特点:基于贝叶斯规则并“朴素”的假设属性独立。只有当事件彼此独立时,概率的相乘才是有效的。
想法:使用属性值和类别值共现的次数,假设 每个属性时同等重要、彼此独立的,来预测新样本的分类。
样本数
转载
2023-11-09 16:08:28
158阅读