Unet 图像分割 python

原创

mob64ca12e1881c 2024-12-01 04:54:51 ©著作权

文章标签 图像分割 python 加载 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12e1881c的原创作品，请联系作者获取转载授权，否则将追究法律责任

教你实现 U-Net 图像分割

U-Net 是一种用于医学图像分割的卷积神经网络，它因其优越的性能而广泛应用于各类图像分割任务。接下来，我们将逐步实现一个简单的 U-Net 图像分割模型。以下是实施流程的概览：

步骤	描述
1	安装所需库
2	加载数据集
3	构建 U-Net 模型
4	编译模型
5	训练模型
6	评估模型
7	可视化结果

1. 安装所需库

首先，我们需要安装必要的 Python 库，如 TensorFlow 和 Keras。你可以在命令行中运行以下命令：

pip install tensorflow numpy matplotlib

2. 加载数据集

在这个步骤中，我们需要准备图像和对应的标签（掩码）。以下代码展示了如何加载数据集：

import os
import numpy as np
import cv2
from sklearn.model_selection import train_test_split

# 加载数据集/掩码函数
def load_data(img_dir, mask_dir):
    images = []
    masks = []
    # 遍历文件夹
    for img_file in os.listdir(img_dir):
        img = cv2.imread(os.path.join(img_dir, img_file))
        mask = cv2.imread(os.path.join(mask_dir, img_file), cv2.IMREAD_GRAYSCALE)
        images.append(img)
        masks.append(mask)

    return np.array(images), np.array(masks)

# 读取图像和掩码
images, masks = load_data('path_to_images', 'path_to_masks')

这段代码中，我们定义了 load_data 函数，该函数读取保存的图像和相应的掩码文件并将其加载到 NumPy 数组中。

3. 构建 U-Net 模型

接下来，我们将构建 U-Net 模型。以下是简单的 U-Net 实现：

import tensorflow as tf
from tensorflow.keras import layers, Model

def unet_model(input_size=(128, 128, 3)):
    inputs = layers.Input(input_size)
    
    # 编码器部分
    c1 = layers.Conv2D(16, (3, 3), activation='relu', padding='same')(inputs)
    c1 = layers.Conv2D(16, (3, 3), activation='relu', padding='same')(c1)
    p1 = layers.MaxPooling2D((2, 2))(c1)

    # 持续添加更多层
    # (省略层，类似 c1)
    
    # 解码器部分
    u6 = layers.Concatenate()([layers.Conv2DTranspose(16, (2, 2), strides=(2, 2), padding='same')(c5), c1])
    c6 = layers.Conv2D(16, (3, 3), activation='relu', padding='same')(u6)
    
    outputs = layers.Conv2D(1, (1, 1), activation='sigmoid')(c6)
    
    model = Model(inputs=[inputs], outputs=[outputs])
    return model

# 创建模型
model = unet_model()
model.summary()

在 unet_model 函数中，我们构建了一个包含编码器和解码器的 U-Net 模型，并使用了 Conv2D 和 MaxPooling2D 层。

4. 编译模型

编译模型是训练之前的必要步骤。我们可以选择合适的损失函数和优化器：

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

这段代码指定使用 Adam 优化器和二元交叉熵作为损失函数。

5. 训练模型

现在我们开始训练模型，通常我们会将数据分成训练集和验证集：

x_train, x_val, y_train, y_val = train_test_split(images, masks, test_size=0.2)

history = model.fit(x_train, y_train, validation_data=(x_val, y_val), epochs=10, batch_size=16)

这个代码片段中，使用 train_test_split 将数据分为训练集和验证集，并开始训练模型。

6. 评估模型

一旦模型训练完成，就可以使用验证集来评估模型性能：

loss, accuracy = model.evaluate(x_val, y_val)
print(f'Loss: {loss}, Accuracy: {accuracy}')

通过 evaluate 方法，我们可以得到模型的损失和准确率。

7. 可视化结果

最后，我们可以通过可视化来展示模型预测的结果：

import matplotlib.pyplot as plt

# 预测并展示结果
predictions = model.predict(x_val)

# 显示结果函数
def display_results(images, masks, predictions):
    plt.figure(figsize=(10, 10))
    for i in range(3):  # 展示3张结果
        plt.subplot(3, 3, i * 3 + 1)
        plt.imshow(images[i])
        plt.title('Original Image')
        
        plt.subplot(3, 3, i * 3 + 2)
        plt.imshow(masks[i].squeeze(), cmap='gray')
        plt.title('True Mask')
        
        plt.subplot(3, 3, i * 3 + 3)
        plt.imshow(predictions[i].squeeze(), cmap='gray')
        plt.title('Predicted Mask')
    plt.show()

display_results(x_val, y_val, predictions)

在这个函数中，我们将图像、真实掩码和预测掩码绘制在一起，以便于比较。

类图与关系图

U-Net 类图

classDiagram
    class UNet {
        +Input input_size
        +conv2D()
        +maxPooling2D()
        +concatenate()
        +conv2DTranspose()
        +modelSummary()
    }

数据集与模型关系图

erDiagram
    DATASET {
        string image_id
        string image_path
        string mask_path
    }
    MODEL {
        string model_id
        string model_architecture
    }
    DATASET ||--o{ MODEL : trains