3d数组转换为稀疏矩阵 python

原创

mob64ca12f86e32 2024-09-07 05:31:45 ©著作权

©著作权归作者所有：来自51CTO博客作者mob64ca12f86e32的原创作品，请联系作者获取转载授权，否则将追究法律责任

3D数组转换为稀疏矩阵的实现方法

在数据处理的过程中，通常会遇到需要将多维数组转换为稀疏矩阵的情境。在本文中，我们将以一个实例来指导你如何在Python中实现“3D数组转换为稀疏矩阵”的过程。这一过程会用到NumPy和SciPy库。

流程概述

首先，让我们了解整个转换流程。下面的表格展示了从3D数组转化为稀疏矩阵的步骤。

步骤	描述
1	创建3D数组
2	确定稀疏矩阵的数据格式
3	提取非零元素的索引和数值
4	使用这些索引和数值创建稀疏矩阵

步骤详解

步骤1：创建3D数组

我们首先需要创建一个3D数组。以下代码演示了如何使用NumPy库生成一个随机的3D数组。

import numpy as np

# 创建一个随机的3D数组，形状为(3, 4, 5)
array_3d = np.random.rand(3, 4, 5)
print("3D数组:")
print(array_3d)

np.random.rand(3, 4, 5)：创建一个3x4x5的数组并填充随机数。

步骤2：确定稀疏矩阵的数据格式

在这里，我们要使用SciPy的coo_matrix格式，它很适合存储稀疏矩阵。稀疏矩阵主要存储非零元素的行索引、列索引和数值。

from scipy.sparse import coo_matrix

# 初始化稀疏矩阵的材料
rows, cols, values = [], [], []

rows、cols和values用来存储矩阵的行索引、列索引和对应的数值。

步骤3：提取非零元素的索引和数值

在这一部分，我们需要遍历3D数组，提取非零元素的索引和数值。

# 遍历3D数组
for i in range(array_3d.shape[0]):  # 外层循环控制第一个维度
    for j in range(array_3d.shape[1]):  # 中间层循环控制第二个维度
        for k in range(array_3d.shape[2]):  # 内层循环控制第三个维度
            if array_3d[i][j][k] != 0:  # 筛选非零元素
                rows.append(i)  # 记录行索引
                cols.append(j * array_3d.shape[2] + k)  # 计算列索引
                values.append(array_3d[i][j][k])  # 记录数值

print("行索引:", rows)
print("列索引:", cols)
print("数值:", values)

array_3d.shape：用于获取数组的形状。
循环内部，逐层访问数组，使用一个条件判断筛选非零值并记录其索引及数值。

步骤4：创建稀疏矩阵

现在我们已经提取了所有必要的信息，接下来可以使用coo_matrix创建稀疏矩阵。

# 创建稀疏矩阵
sparse_matrix = coo_matrix((values, (rows, cols)), shape=(array_3d.shape[0], array_3d.shape[1] * array_3d.shape[2]))

print("稀疏矩阵:")
print(sparse_matrix)

coo_matrix接收数值、索引和形状作为参数来创建稀疏矩阵。

序列图

我们可以使用序列图来表示整个流程：

sequenceDiagram
    participant U as 用户
    participant N as NumPy
    participant S as SciPy
    U->>N: 创建3D数组
    N->>U: 返回随机3D数组
    U->>S: 准备行、列、值的索引
    U->>N: 遍历3D数组
    U->>N: 筛选出非零元素
    U->>S: 创建稀疏矩阵
    S->>U: 返回稀疏矩阵