趁这个周末的时间整理了下之前学习的一些python 基础部分内容,作为一个复习。内容较长分为了几个部分,本文代码在Jupyter Notebook中运行。'''Python1.变量常用的数据类型:int,float,str(可用''/""/''''''),bool,none. 用type()来判断变量类型2.变量命名原则:数字/字母/下划线/中文注意:使用变量前要先声明变量,通过=赋值的形式声明;
1.集合类型的定义
2.集合操作符
3.集合处理方法
4.集合类型应用场景
1.集合类型的定义
集合是多个元素的无序组合
集合类型与数学中的集合概念一致
集合元素之间无序,每个元素唯一,不存在相同元素
集合元素不可更改,不能是可变数据类型
建立集合用大括号 {} 表示,元素间用逗号分隔
建立集合类型用 {} 或 set()
建立空集合类型,必须使用 set()
使用 {} 建立集合
>>
转载
2023-08-02 21:46:57
69阅读
# Python DataFrame 筛选包含集合的 DataFrame
Python 中的数据处理离不开 `pandas` 库,而在 `pandas` 中,`DataFrame` 是一种非常有用的数据结构,可以用来存储和操作复杂的数据集。有时候,我们需要从一个 `DataFrame` 中筛选出包含特定集合的数据。本文将通过详细的代码示例和图解来讲解如何做到这一点。
## 1. 什么是 Dat
# 在Python中按行输出DataFrame的集合元素
数据分析是一个现代社会中非常重要的技能,而Pandas库是Python中最常用的数据分析工具之一。Pandas提供了丰富的功能,以便我们高效地处理数据。在这篇文章中,我们将探讨如何将DataFrame中的集合元素换行输出,并结合一些图示说明相关的概念和方法。
## 什么是Pandas DataFrame
Pandas中的DataFra
一.学习内容概括 今天学习了数据类型中的字符串和字典的定义、创建、元素增减等具体操作。二. 具体学习内容字符串(1)字符串的定义Python 中字符串被定义为引号之间的字符集合;支持使用成对的 单引号 或 双引号 (2)Python 的常用转义字符 常用转义字符:''' '''多行字符串可用三引号括起;r'原字符串' 输出原字符串; 当输出需要有引号时, 转义
转载
2023-11-04 22:38:00
59阅读
文章目录示例数据展示例子筛选说明直接筛选基于map的筛选使用query()方法筛选总结:参考资料 我的这篇笔记不记录排序、分组、替换,只记录筛选功能的三种常见的方法。直接筛选(推荐)基于map方法的筛选(在方法一的基础上,十分推荐)query方法(不推荐)示例数据展示all_data = pd.read_csv('data.csv')
print(all_data.info())
print(a
转载
2023-10-26 12:45:59
62阅读
python列表一、列表的创建与操作1.创建列表a = [] ##元素类型可为int,float,complex,str,list,tuple
b = [a, 1, True, 3j + 2, "hi"]
c = [[1, 2, 3, 4], [a, b], 233, "hello"]
d = [a, b, c ]2.列表的索引与切片>>> c = [[1, 2, 3, 4
转载
2024-07-05 19:45:25
46阅读
# 使用Python处理DataFrame去重并转换为List集合
在数据分析和处理的过程中,我们经常需要对数据进行去重操作,以确保数据的唯一性。当我们使用Python的Pandas库处理DataFrame时,去重操作非常简单,同时我们也可以将去重后的数据转换为List集合。本文将详细介绍这一过程,请跟随我们的示例代码和可视化的流程图一起学习。
## 一、理解DataFrame与去重
在Pa
原创
2024-08-19 04:06:55
170阅读
# Python DataFrame 过滤包含在集合中的元素
在数据分析和数据处理的过程中,我们常常需要对数据进行过滤。Pandas是Python中一个强大的数据分析库,它提供了灵活而方便的数据结构(如DataFrame)来处理数据。本文将介绍如何在Pandas的DataFrame中,过滤出包含在特定集合中的元素,并通过代码示例进行说明。
## 1. 什么是DataFrame?
DataFr
这篇笔记对几个常用的集合实现,从效率,线程安全和应用场景进行综合比较。1.ArrayList、LinkedList与Vector的对比(1)相同和不同 都实现了List接口,使用类似。 Vector和ArrayList的底层实现都是数组,这一点与LinkedList的双向链表不同。 Vector和ArrayList在更多元素添加进来时会请求更大的空间。Vector每次请求其大小的双倍空间,而Arr
转载
2024-09-11 22:58:25
16阅读
容器:可以存放多个元素的一种数据类型,补充变量的无法存储大量数据的缺陷。列表(list):类似于数组,可以存储多种类型的数据 例如:字符串,汉字,单个字符,列表,等等创建列表 法一:利用python的弱数据类型ls=[1,2,'xixi',[1,19,0]]
ls
[1, 2, 'xixi', [1, 19, 0]]法二:利用全局函数listls1=list([9,0,34,'xixi',[1,
转载
2024-03-11 11:18:33
30阅读
今天是第三天学习,加油! 第一部分 集合一、集合1.什么是集合以及特性?特性:无序的,不重复的序列,可嵌套。2.创建集合方法一:创建空集合 s1 = set()
print(type(s1)) 结果: 可以看出来创建的是集合类型的。 方法二: s1 = {"123","456"}
print(s1)
print(type(s1)) 结果: 方法三:列表转换为集
转载
2023-10-04 09:53:29
510阅读
一、列表1、列表的定义列表list用[ ]标识,支持数字,字符串,也可以包含列表嵌套,创建一个列表,只要把逗号分隔的不同数据项使用方括号括起来即可list1 = ['银行存款', '库存现金', '应收账款']list2 = [666, 999, 888]list3 = [] #方括号里面什么都不写,代表创建一个空列表2、列表计算与字符串一样,列表的每个元素都对应一个索引号+:拼接*:重复[ ]:
转载
2023-08-20 23:46:08
171阅读
Python将hive的table表转成dataframe一步到位,代码如下:from pyhive import hive
import pandas as pd
def hive_read_sql(sql_code):
connection = hive.Connection(host='10.111.3.61', port=10000, username='account')
转载
2023-05-30 19:21:00
137阅读
# Spark DataFrame 集合去重指南
作为一名经验丰富的开发者,我很高兴能帮助刚入行的小白们解决实际问题。今天,我们将一起学习如何在 Spark 中对 DataFrame 集合进行去重操作。
## 流程概览
首先,让我们通过一个流程图来了解整个去重操作的步骤:
```mermaid
flowchart TD
A[开始] --> B[读取数据]
B --> C{是
原创
2024-07-28 09:54:29
45阅读
1. SeriesSeries 是一个类数组的数据结构,同时带有标签(lable)或者说索引(index)。1.1 下边生成一个最简单的Series对象,因为没有给Series指定索引,所以此时会使用默认索引(从0到N-1)。# 引入Series和DataFrameIn [16]: from pandas import Series,DataFrame
In [17]: import pandas
DataFrame.sampleDataFrame.sample方法主要是用来对DataFrame进行简单随机抽样的。PS:这里说的是简单随机抽样,表示是不能用来进行系统抽样、分层抽样的。DataFrame.sample这个方法可以从DataFrame中随机抽取行,也可以随机抽取列,这个方法接收的参数如下:DataFrame.sample(n=None
, frac=None
, replace=
转载
2023-07-10 21:22:22
190阅读
1. 基础数据准备import pandas as pd
data = [{"a": 1, "b": ' djidn. '},
{"a": 11, "b": 22.123456},
{"a": 111, "b": ''},
{"a": 1111},
{"a": '1111'}]
df = pd.DataFrame(da
转载
2023-06-08 10:46:41
176阅读
DataFrameDataFrame 概念和创建 :先来看一个例子 :这是一个由列表组成的字典importnumpy as npimportpandas as pddata= {'name':['Jack','Tom','Mary'],'age':[18,19,21],'gender':['m','m','w']}frame=pd.DataFrame(data)print(frame)可以看到 D
转载
2023-07-21 22:08:11
223阅读
python DataFrame常用描述性统计分析方法 文章目录python DataFrame常用描述性统计分析方法sum() 求和mean() 求平均值max() 最大值 & min() 最小值median() 中位数mode() 众数var() 方差std() 标准差quantile() 分位数 sum() 求和使用sum()方法对DataFrame对象求和。 其中**set_opt
转载
2023-07-14 16:08:08
183阅读