Python 是一种用于进行数据分析的出色语言,主要是因为以数据为中心的 Python 包的奇妙生态系统。Pandas 就是其中之一,它使导入和分析数据变得更加容易。
将 pandas 对象强制转换为指定的 dtype
DataFrame.astype() 函数用于将 pandas 对象转换为指定的 dtype。astype()
函数还提供将任何合适的现有列转换为分类类型的能力。
代码 #1: 转换权重列数据类型。
由于数据有一些“nan”值,所以为了避免任何错误,我们将删除所有包含任何nan
值的行。
输出:
为输入对象列推断更好的数据类型
DataFrame.infer_objects() 函数尝试为输入对象列推断更好的数据类型。此函数尝试对对象类型化列进行软转换,使非对象列和不可转换列保持不变。推理规则与正常的 Series/DataFrame 构造期间相同。
代码 #1: 使用infer_objects()
函数推断更好的数据类型。
输出 :
让我们看看数据框中每一列的dtype(数据类型)。
正如我们在输出中看到的,第一列和第三列是object
类型。而第二列是int64
类型。现在切片数据框并从中创建一个新的数据框。
输出 :
正如我们在输出中看到的,列“A”和“C”是对象类型,即使它们包含整数值。所以,让我们试试这个infer_objects()
功能。
输出:
现在,如果我们查看每一列的 dtype,我们可以看到列“A”和“C”现在是int64
类型。
检测缺失值
DataFrame.isna() 函数用于检测缺失值。它返回一个布尔值相同大小的对象,指示值是否为 NA。NA 值,例如 None 或 numpy.NaN,被映射到 True 值。其他所有内容都映射到 False 值。空字符串 ” 或 numpy.inf 等字符不被视为 NA 值(除非您设置 pandas.options.mode.use_inf_as_na = True)。
代码 #1: 使用isna()
函数检测数据帧中的缺失值。
让我们使用该isna()
函数来检测缺失值。
输出:
在输出中,对应于缺失值的单元格包含真值,否则为假。
检测现有/非缺失值
DataFrame.notna()函数检测数据框中的现有/非缺失值。该函数返回一个与应用它的对象大小相同的布尔对象,指示每个单独的值是否为na值。所有非缺失值都映射为 true,缺失值映射为 false。
代码 #1: 使用notna()
函数查找数据框中的所有非缺失值。
让我们使用该dataframe.notna()
函数查找数据框中的所有非缺失值。
输出:
正如我们在输出中看到的,数据帧中的所有非缺失值都已映射为真。没有错误值,因为数据框中没有缺失值。
DataFrame中的转换方法
功能 | 描述 |
DataFrame.convert_objects() | 尝试为对象列推断更好的 dtype。 |
DataFrame.copy() | 返回此对象的索引和数据的副本。 |
DataFrame.bool() | 返回单个元素 PandasObject 的布尔值。 |