movie.csv
序号,名称
1,21
2,324
3,31
2,312
1,3
代码
import pandas as pd
import numpy as np
movie = pd.read_csv('data/movie.csv') #用read_csv()方法读取csv文件
movie.head() #head()方法可以查看前五行,head(n)可以查看前n行
movie.shape #数据shape
movie2=movie.set_index('序号') #数据shape的行索引设置为'序号'
movie2=pd.read_csv('data/movie.csv', index_col='序号') #同上set_index
movie2.reset_index() #复原行索引
movie3=movie.rename(index={}, columns={'序号':'ID'}) #重命名行名、列名
columns=movie.columns #获取列索引
columns.values #获取列内容
index=movie.index #获取行索引
index_list=index.tolist() #获取行索引列表
index_list[0]='00' #行索引第一项变为00
movie.index = index_list #更新行索引
movie['new_column'] = 0 #增加新的列,并进行赋值
movie['new_column1']=movie['序号']+movie['名称'] #增加新的列,赋值操作,别的列进行+操作
movie['new_column'].all() # 用all()检查是否所有的布尔值都为True
movie.drop('new_column',axis='columns') # 用drop删除行、列数据
name_index=movie.columns.get_loc('名称') + 1 # get_loc获取‘名称’列的位置索引
movie.insert(name_index, column='name_next',value=movie['名称']) # insert插入一列
print(movie)
data=movie.values #获取数据
data[0] #获取第一行数据
movie.dtypes #各列数据类型
movie['序号'] #获取'序号'列数据
movie.序号 #获取'序号'列数据
ID=movie['序号']
ID.name #获取'序号'列数据的列名称
ID.to_frame().head() #单列Series转换为DataFrame,返回'序号'列所有数据
s_attr_methods = set(dir(pd.Series)) #获取Series下所有不重复指令
df_attr_methods = set(dir(pd.DataFrame))#获取DataFrame下所有不重复指令
ID.head() #获取'序号'列数据
ID.value_counts() #获取'序号'列数据计数
ID.value_counts().head(3) #获取'序号'列 计数查看前三
ID.value_counts(normalize=True) #获取'序号'列 返回频率
ID.size #获取'序号'列 数据size
ID.shape #获取'序号'列 数据shape
len(ID) #获取'序号'列 数据长度
ID.count() #获取'序号'列 数据非空数值统计
ID.quantile() #获取'序号'列 数据中位分位数
ID.min() #获取'序号'列 数据最小值
ID.max() #获取'序号'列 数据最大值
ID.mean() #获取'序号'列 数据平均值
ID.median() #获取'序号'列 数据中位数
ID.std() #获取'序号'列 数据标准差
ID.sum() #获取'序号'列 数据总和
ID.describe() #获取'序号'列 打印描述信息
ID.isnull() #获取'序号'列 非空判断
ID.isnull().sum() #获取'序号'列 统计缺失值的数量
ID.isnull().mean() #获取'序号'列 缺失值的比例
ID.fillna(0) #获取'序号'列 填充缺失值
ID.fillna(0).astype(int).head() #获取'序号'列 缺失值填充为0、转换为整型、查看前五
ID.dropna() #获取'序号'列 删除缺失值
ID.hasnans #获取'序号'列 判断是否有缺失值
ID.notnull() #获取'序号'列 判断是否是非缺失值
ID+1 #获取'序号'列 值+1操作
ID>7 #获取'序号'列 判断是否>7
ID==1 #获取'序号'列 判断是否==1
ID.add(1) #获取'序号'列 值+1操作
ID.mul(1) #获取'序号'列 值*1操作
ID.floordiv(7) #获取'序号'列 值//7操作
ID.gt(7) #获取'序号'列 值>7操作
ID.eq(7) #获取'序号'列 值==7操作
ID.mod(5) #获取'序号'列 值%7操作
ID.dtype #获取'序号'列 数据类型