简介 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你 ...
转载 2021-10-17 20:56:00
102阅读
2评论
Pandas Pandas的命名来自于面板数据这个概念,即Panel datas 一些注意事项 axis 的轴向,主要看延展的方向,比如说有个矩阵AB,你想把他们上下合并,虽然看起来是一行行的在加,但是它实际的延展方向是竖着的,所以是axis=0, shape = (3,4) 上下合并,之后axis ...
转载 2021-08-30 13:08:00
202阅读
2评论
你也可以链接查看。内容包括:基本选择方式loc,iloc方式使用布尔作为索引
原创 2022-10-26 21:02:51
32阅读
一、Series一维容器 import pandas as pd # 创建时传入可迭代对象即可 s1 = pd.Series(r
原创 2022-08-18 09:06:00
236阅读
...
转载 2021-09-30 16:09:00
121阅读
2评论
由于博客对markdown的不完全支持,由jupyter notebook导出的md不能很好的显示,所
原创 2022-10-27 12:42:01
55阅读
Pandas是python第三方库,提供高性能易用数据类型和分析工具
原创 2018-12-16 13:54:23
8107阅读
1点赞
你也可以外链查看。 内容包括:简单统计、数据应用函数、计数统计、字符串处理、合并操作、分组、绘图等。 本系列笔记较于简单,此文为关于pandas笔记最后一篇。如需详细应用,可参考官方教程,其API地址如:http://pandas.pydata.org/pandas-docs/stable/api.html。...
原创 2022-10-26 17:04:07
216阅读
你也可以外链查看。内容包括:设置数值缺失值处理
原创 2022-10-27 12:35:14
48阅读
python pandas 学习
原创 2018-10-16 17:18:30
1764阅读
读取Excel 1、直接通过pd.read_excel()读取xlsx/xls文件 df = pd.read_excel("fileName.xlsx",sheet_name=sheet_name) 2、通过pd.ExcelFile()读取文件后使用parse()读取指定表格 xlsx_file = ...
转载 2021-08-04 21:16:00
105阅读
2评论
一、Pandas简介Pandas是使用Python语言开发的用于数据处理和数据分析的第三方库。它擅长处理数字型数据和时间序列数据,当然文本型的数据也能轻松处理。作为Python的三方库,Pandas是建构在Python的基础上的,它封装 了一些复杂的代码实现过程,我们只要调用它的方法就能轻松实现我们的需求。Pandas参考文档:https://pandas.pydata.org/docs/Pand
原创 2023-07-15 21:34:48
329阅读
Pandas系列文章:
原创 2022-12-15 20:01:41
70阅读
1、筛选用法 loc、where • orgin_excel.loc[(orgin_excel['投资时间'].astype(str) <'2020-10-01')&(orgin_excel['数据状态'].isnull())&(orgin_excel['数据源'].str.contains('调研 ...
转载 2021-09-30 16:24:00
67阅读
2评论
一、Dataframe基本概念 # 二维数组"Dataframe:是一个表格型的数据结构,包含一组有序的列,其列的值类型可以是数值、字符串、布尔值等。 data = {'name': ['Jack', 'Tom', 'Mary'], 'age': [18, 19, 20], 'gender': ['
原创 2024-09-25 17:36:04
145阅读
1 merge+drop_duplicated(how=left, subset) 如果左表本身就是有重复的 需要先给左表生成一个每行唯一索引 才能实现vlookup的效果2 对某一列的每一行进行判断赋值 即for i in 行数:  df.loc[如果i==?, 某列]= 赋值其中 如果是在另一列的基础上进行赋值 赋值可以是 df['另一列'].loc[i]+-*/ 也可以直接整列df
原创 2023-05-09 11:03:42
143阅读
一、Series基本概念及创建 1.基本概念 # Series 数据结构 # Series 是带有标签的一维数组,可以保存任何数据类型(整数,字符串,浮点数,Python对象等),轴标签统称为索引 # 导入numpy、pandas模块 import numpy as np import pandas
原创 2024-09-25 17:36:12
341阅读
:行
原创 2023-05-29 11:10:18
96阅读
  数据对象 pandas主要有两种数据对象:Series、DataFrame   注: 后面代码使用pandas版本0.20.1,通过import pandas as pd引入   1. Series   Series是一种带有索引的序列对象。   简单创建如下:   # 通过传入一个序列给pd.Series初始化一个Series对象, 比如lists1=pd.Series(list("12
转载 2021-06-28 10:19:47
161阅读
10 Minutes to pandas / / /
转载 2018-01-25 17:57:00
39阅读
2评论
  • 1
  • 2
  • 3
  • 4
  • 5