Numpy的数组基本索引与切片附ndarray的数据类型

  • 一、 数组的切片操作
  • 列表的切片
  • 数组切片的自动传播
  • 二、布尔值索引
  • 三、Ndarray的数据类型


一、 数组的切片操作

列表的切片

在了解numpy的数组切片之前,我们首先来看看list切片操作。显然,切片操作会将原始数组的选区进行复制然后赋值给新的变量list_slice,这样在对切片进行操作时,原列表数值并不会发生改变。

list = [1 for x in range(10)]
print(list)
list_slice = list[3:5]
list_slice[1] = 12
print(list)
print(list_slice)
""" output:
[1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
[1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
[1, 12]
"""

数组切片的自动传播

进行切片操作比如arr[2:3]=1时,这个赋值会自动传播到原来的数组中。例如如下操作:

Js Array 索引 array具有索引_数组

先创建一个全一数组。然后对arr进行切片并且给另一个变量arr_slice。然后对arr_slice的第二个数值进行赋值,然后输出arr。可以到原数组arr也随之发生了变化。这说明,我们在进行切片操作的过程中,数组切片仅仅是一个原始数组的缩小视图。这意味着,切片操作不会对数据进行复制,切片的任何数值改变都会反映到原数组中。

Js Array 索引 array具有索引_Js Array 索引_02

arr_slice = arr[3:5]
arr_slice[1]=12
print(arr)
# output : [ 1.  1.  1.  1. 12.  1.  1.  1.  1.  1.]

二、布尔值索引

首先来看一个失败的案例:
可以看到,输出的结果为false,说明并不能直接对列表进行布尔值索引操作。

import numpy as np
name = ['wuqian', 'hua','wuqian', 'wanglihon']
date = np.random.randn(4,4)
name == 'wuqian'
#output:False

应该先把字符列表转化为array类型。

import numpy as np
name = np.array(['wuqian', 'hua','wuqian', 'wanglihon'])
data = np.random.randn(4,4)
name == 'wuqian'  # 该操作和算数运算一样,数组比较运算也是矢量化的,会挨个对照,然后输出True or False
# 输出是一个布尔型数组
"""
output:array([ True, False,  True, False])
"""
# 然后这个布尔值数组能够对数组进行索引
data[name == 'wuqian']
"""
输出的是data数据的对应布尔型数组中True位置的数据。
# output: array([[-0.05095068, -0.21921446,  0.30479235,  0.07790257],
       [-0.46580753, -0.3457661 , -0.40843969, -0.97014426]])
       """

需要十分注意的一个点是
使用该种索引,要求布尔型数组的长度必须根呗索引的轴长度是一致的。
另外还可以灵活利用&、|、!=非之类的布尔算数运算符号或者大于小于等,如下操作示例:

huairen = (name == 'wuqian')|(name = 'hua')
name !='wuqian'
score = np.array([100, 99, 78, 12, 0, 65])
score = score.astype(np.unicode_)
score[score>'60'] = '及格'
score
# output: array(['100', '及格', '及格', '12', '0', '及格'], dtype='<U11')

三、Ndarray的数据类型

1.数据类型查看

arr1 = np.array([1,3,4])
arr1.dtype
# 如果没有指定特定的数据类型,一般都是float64

数据类型符号

string_ 固定长度字符串类型,每个字符一个字节

unicode_ 固定长度的unicode类型,字节数由使用平台决定

float64 标准单精度的浮点数


Js Array 索引 array具有索引_python_03


2. 如何改变数据类型

可以通过新建数据的时候指定数据类型:

arr = np.array([1,3,4,1],dtype = np.int64)

如果数组已经建立需要改变,可以如下操作:

arr = arr.astype(np.unicode)