python数据分析工具pandas中DataFrame和Series作为主要的数据结构. 本文主要是介绍如何对DataFrame数据进行操作并结合一个实例测试操作函数。1)查看DataFrame数据及属性 df_obj = DataFrame() #创建DataFrame对象 df_obj.dtypes #查看各行的数据格式 df_obj['列名'].astype(int)#转换某列
【摘要】通过列表生成式,可以直接创建一个列表,但是受内存限制,列表容量都是有限的。而且,创建一个包含100万个元素的列表,不仅占用空间很大,如果仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白费了。python中,有一种一边循环一边计算的机制,称为生成器(generator)1.生成器的创建方法一:直接把一个列表生成式的[ ]改成( ),即可创建一个generator# 生成器创建 nu
Python将hive的table表转成dataframe一步到位,代码如下:from pyhive import hive import pandas as pd def hive_read_sql(sql_code): connection = hive.Connection(host='10.111.3.61', port=10000, username='account')
转载 2023-05-30 19:21:00
137阅读
1. SeriesSeries 是一个类数组的数据结构,同时带有标签(lable)或者说索引(index)。1.1 下边生成一个最简单的Series对象,因为没有给Series指定索引,所以此时会使用默认索引(从0到N-1)。# 引入Series和DataFrameIn [16]: from pandas import Series,DataFrame In [17]: import pandas
  Pandas是为了解决数据分析任务而创建的,纳入了大量的库和标准数据模型,提供了高效地操作大型数据集所需的工具。  对于Pandas包,在Python中常见的导入方法如下:from pandas import Series,DataFrame import pandas as pd首先,我们需要对于Series和DataFrame有个基本的了解:Series:一维数组,类似于Python中的基
转载 2023-07-21 12:31:06
91阅读
首先,这两种数据类型是python中pandas包中的,使用之前记得导包目录初步认识series组成创建获取运算dataframe创建初步认识1、DataFrame可以看成一个矩形表格(比如m行n列的数据)甚至是整个表格,存储的是二维的数据,可以被看做是由Series组成的字典,每一个坐标轴都有自己的标签。2、Series则是DataFrame中的一列,存储的是一维的数据。series组成Seri
转载 2023-07-14 16:46:52
102阅读
1. 基础数据准备import pandas as pd data = [{"a": 1, "b": ' djidn. '}, {"a": 11, "b": 22.123456}, {"a": 111, "b": ''}, {"a": 1111}, {"a": '1111'}] df = pd.DataFrame(da
转载 2023-06-08 10:46:41
176阅读
python DataFrame常用描述性统计分析方法 文章目录python DataFrame常用描述性统计分析方法sum() 求和mean() 求平均值max() 最大值 & min() 最小值median() 中位数mode() 众数var() 方差std() 标准差quantile() 分位数 sum() 求和使用sum()方法对DataFrame对象求和。 其中**set_opt
DataFrame.sampleDataFrame.sample方法主要是用来对DataFrame进行简单随机抽样的。PS:这里说的是简单随机抽样,表示是不能用来进行系统抽样、分层抽样的。DataFrame.sample这个方法可以从DataFrame中随机抽取行,也可以随机抽取列,这个方法接收的参数如下:DataFrame.sample(n=None , frac=None , replace=
DataFrameDataFrame 概念和创建 :先来看一个例子 :这是一个由列表组成的字典importnumpy as npimportpandas as pddata= {'name':['Jack','Tom','Mary'],'age':[18,19,21],'gender':['m','m','w']}frame=pd.DataFrame(data)print(frame)可以看到 D
最简单的方法:new_list = [ x for x in li if x != '' ]这一部分主要学习pandas中基于前面两种数据结构的基本操作。设有DataFrame结果的数据a如下所示:a b cone 4 1 1two 6 2 0three 6 1 6一、查看数据(查看对象的方法对于Series来说同样适用)1.查看DataFrame前xx行或后xx行a=DataFrame(data
这个repo 用来记录一些python技巧、书籍、学习链接等,欢迎star github地址用pandas中的DataFrame时选取行或列:import numpy as np import pandas as pd from pandas import Sereis, DataFrame ser = Series(np.arange(3.)) data = DataFrame(np.ara
转载 2023-07-10 21:18:47
100阅读
前面一节我们学习了concat()把两个Series或者DataFrame表格进行连接,连接是基于相同结构的两个表的简单连接。在实际工作中,数据往往在不同的表中进行拼凑才能取得最终的结果,而这个拼凑过程在Pandas中叫做merge()。先来做一下数据准备。 left = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': np.
怎样删除list中空字符? 最简单的方法:new_list = [ x for x in li if x != ” ]设有DataFrame结果的数据a如下所示: a b c one 4 1 1 two 6 2 0 three 6 1 6一、查看数据(查看对象的方法对于Series来说同样适用) 1.查看DataFrame前xx行或后xx行a
官方网址:https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.aggregate.html目的该篇文章主要线路为探索agg的基本用法,以及对应有哪些适用场景,最后做一个简单探索源代码层。1、介绍agg的参数及使用demo2、GroupBy的agg用法案例3、通过查看底层推演agg的路线原理1、介绍agg的参数及使用demoag
 print np.mean(df.title.apply(lambda x: len(x))) # 24.072694718 print df.title.apply(lambda x: len(x) < 30).value_counts() """ True 4069 False 1516 """ 
转载 2023-07-03 23:30:09
127阅读
# Python复数的用处 ## 1. 流程表格 ```mermaid journey title Python复数的用处流程 section 理解什么是复数 开始 --> 理解复数 --> 了解复数在数学和编程中的作用 --> 结束 ``` ## 2. 步骤及代码 ### 2.1 理解什么是复数 在数学中,复数是由实数和虚数部分组成的数,形式为`a +
原创 2024-04-26 04:11:16
39阅读
import numpy as nprequired_input = required_input.replace(np.nan, '') query_result_input = query_result_input.replace(np.nan, '') 将指定列toy的空值替换成指定值100: df.replace({'toy':{np.nan:100}}) 筛选有缺失值的行 df.lo
转载 2023-05-28 18:12:13
114阅读
Pandas 应用 Pandas 的主要数据结构是 Series (一维数据)与 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。数据结构Series 是一种类似于一维数组的对象,它由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成。DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值
官方帮助文档解释;DataFrame.sum(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)axis : {index (0), columns (1)},axis=0代表对列进行求和,axis=1代表对行进行求和。调用DataFrame的sum方法将会返回一个含有列
转载 2023-05-28 18:35:32
69阅读
  • 1
  • 2
  • 3
  • 4
  • 5