数据分析三剑客(三个模块):numpy、pandas、matplotlib;前两个属于数据分析,展示数据,后一个用于画图;pandas中有两个常用的类:SeriesDataFrame;Series对象是类似一维数组的,由下面两个部分组成:values:一组数据(ndarray类型) index:相关的数据索引标签DataFrame是一个【表格型】的数据结构,可以看做是【由Series组成的字典】
转载 2024-06-13 12:48:31
100阅读
我们先要了解,pandas是基于Numpy构建的,pandas中很多的用法numpy一致。pandas中又有seriesDataFrameSeriesDataFrame的基础。pandas的主要功能:具备对其功能的数据结构DataFrameSeries集成时间序列功能提供丰富的数学运算操作灵活处理缺失数据,处理NaN数据(******)一、SeriesSeries是一种类似于一维数组的
转载 2024-03-19 15:40:21
93阅读
最近接触到数据科学,需要对一些数据表进行分析,观察到代码中一会出现loc一会又出现iloc,下面对两者的用法给出我的一些理解。1.联系(1)操作对象相同:lociloc都是对DataFrame类型进行操作;(2)完成目的相同:二者都是用于选取DataFrame中对应行或列中的元素。2.区别lociloc索引的行列标签类型不同。iloc使用顺序数字来索引数据,而不能使用字符型的标签来索引数据;注
转载 2023-08-20 19:59:37
598阅读
【代码】Pandas基础用法。
原创 2022-10-08 07:46:37
677阅读
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。 适用人群:机器学习初学者,转AI的开发人员。 编程语言:Python自己在项目中经常用到pandas,尤其是数据分析与数据预处理这两部分,自己最直接的感受就是pandas像是SQL+excel,当然,pandas的功能远不止这些。DataFrameSeries的区别DataFrameSeries是Pandas的两大基
转载 2024-06-15 15:06:05
41阅读
之前介绍的Numpy适合处理同质型的数值类数组数据,而pandas是用来处理表格型或者异质性数据。这篇博文主要是来简要介绍pandas的两个常用的工具数据结构:SeriesDataFrame。 文章目录SeriesDataFrame SeriesSeries是一维的数组型对象,包含一个值序列,并且包含了数组标签,称为索引。可以被认为是一个长度固定且有序的字典。pandas中标记缺失值或NA值的方
转载 2024-01-14 20:17:41
96阅读
3.7 合并数据集:Concat与Append操作  将不同的数据源进行合并是数据处理中最常见的操作,包括将两个不同数据集简单地拼接,也包括处理有重叠字段的数据集。SeriesDataFrame都具备这类操作,Pandas的函数与方法让数据合并变得更加快速.In [1] :import numpy as np import pandas as pd 为了简单起见,定义一个能够创建DataFr
       pandas中,有时候需要对多个SeriesDataFrame进行连接拼合,对此pandas中一般有三种方法:merge()、join()、concat()。下面一一进行简单的介绍。行连接的,对于两个DataFrame,可以用参数on指定用来merge的共同列,也可以利用left_onright_on分别指定用来merge的列,还可以利用h
转载 2024-06-24 07:37:01
351阅读
在使用pandas的时候,经常要对DataFrame的某一列进行操作,一般都会使用df["xx"].str下的方法,但是都有哪些方法呢?我们下面来罗列并演示一下。既然是df["xx"].str,那么xx这一列必须是字符串类型,当然在pandas里面是object,不能是整形、时间类型等等。如果想对这些类型使用的话,必须先df["xx"].astype(str)转化一下,才能使用此方法。数据集数据如
转载 2024-04-01 17:36:50
73阅读
        在使用pandas框架的DataFrame的过程中,如果需要处理一些字符串的特性,例如判断某列是否包含一些关键字,某列的字符长度是否小于3等等这种需求,如果掌握str列内置的方法,处理起来会方便很多。        &nbs
转载 2024-05-08 13:19:58
39阅读
原创 2021-08-02 15:39:01
389阅读
文章目录Series简单介绍创建series访问series通过标签下标访问通过位置下标访问通过标签切片访问通过位置切片访问通过布尔数组访问通过花式下标访问DataFrame简单介绍创建DataFrame对象使用列表创建使用字典创建使用列表嵌套字典创建使用字典嵌套Series创建 Series简单介绍1.Series对象是一种带有标签的一维数组对象 2.能够保存任何数据类型 3.Series对象
文章目录1.Numpy Pandas 的比较2.Series3.DataFrame4.DataFrame 的简单运用 1.Numpy Pandas 的比较如果用 python 的列表字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式。Pandas是基于Numpy构建的,让Numpy为中心的应用变得更加简单。要使用pandas,首先需要了解
pandas中主要有两种数据结构:Series DataFrameSeries 是带有轴标签(索引)的一维数组。 DataFrame 是二维表格数据,有行索引也有列索引,可以看作是扩展的 Series。 文章目录Series DataFrame 的区别Series 数据构建Series 数据读取Series 排序、缺失值 Series DataFrame 的区别我们可以通过下面的例
pandas主要有两个数据结构:seriesdataframe一、序列import numpy as np import pandas as pd obj = pd.Series([2,1,4,3]) obj.values ##序列的值 obj.index ##序列的索引 obj[2] obj2 = pd.Series([4,3,5,2],index = ['a','b','c','
转载 2023-07-21 12:33:33
618阅读
# 使用Python中的Pandas库进行DataFrame相乘 在数据分析处理中,Pandas库是Python中一个非常强大和常用的工具。Pandas提供了一个名为DataFrame的数据结构,利用它我们可以很方便地处理分析各种数据。在实际应用中,我们有时会需要对DataFrame进行相乘操作,下面就来介绍如何使用Pandas库进行DataFrame相乘操作。 ## 创建DataFram
原创 2024-05-13 04:46:50
179阅读
在我们平时使用Excel表格的时候,我们往往会因为某些工作需求,需要对表格当中的数据进行求和、求差,或求平均值。而这些计算方法也都是我们日常当中经常会使用到的。而乘法在Excel表格当中,我们用到的地方可能不多,但是这也并不意味着就用不到,很多小伙伴还是会在Excel表格当中遇到需要进行批量算乘法的操作需求,而此时,如果数据较少的话,我们可以一点一点的去算,但是如果数据非常多,那么这样做无疑就不合
用python进行数据分析时经常要用到pandas库,为了以后便于查询,我对pandas库的两个主要数据结构SeriesDataFrame的创建和使用方法进行了简单总结。Series从概念上说,Series是一个一维数组。但是普通的python列表不同的是,Series支持索引。普通的python列表只能根据下标来查找特定位置的元素,而Series既可以按下标索引,也可以按照给定的keys进行
转载 2023-11-03 12:04:38
91阅读
本篇文章主要讲一讲python的pandas库的一些使用(也算自己学习当中的整理): 数据分析的搭配环境,大家可以去参照安装下载好:1.Pandas提供的数据结构函数的设计,将使表格数据的工作快速、简单、更易懂。所以利用Pandas进行数据操作、预处理、清洗是Python数据分析中的重要技能。 常见的数据存储形式有Excel和数据库这两种,不管是Excel还是数据库他们存储数据的方式都是以表格样
转载 2023-10-14 16:52:32
135阅读
一、Pandas库 与我们之前用到的NumPy库以及我们之后会用到的Matplotlib等库一样,Pandas库也是一个被大家广泛使用的一个第三方库。大家主要用它来进行数据分析的操作,这也是为什么我们这门课要来学习它的原因之一。在Pandas库中我们经常会跟它其中的两种数据类型打交道:SeriesDataFrame。相比于我们上一章学习的数组,SeriesDataFrame最明显的特点在于它们
  • 1
  • 2
  • 3
  • 4
  • 5