瞎聊深度学习——TensorFlow的基本应用

原创

二哥不像程序员 2023-02-27 12:16:42 博主文章分类：深度学习 ©著作权

文章标签 Tensorflow 深度学习 tensorflow 矩阵相乘赋值 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者二哥不像程序员的原创作品，请联系作者获取转载授权，否则将追究法律责任

首先来说一下TensorFlow的几个关键词：

图（graph）、会话、张量（tensor）、变量（Variable）、feed、fetch。

说一下上面关键词的作用：

用图（graph）来表示计算任务
在被称之为会话（Session）的上下文（context）中执行图
使用tensor表示数据
通过变量（Variable）维护状态
用feed和fetch可以为任意操作赋值或者从中获取数据

张量（tensor）是什么？

我们可以把张量认作是基于向量和矩阵的推广，举几个实例来表示一下N阶标量都代表什么：

阶	数学实例	实例表示
0	常数（只有大小）	s = 123
1	向量（有大小和方向）	v = [1.2，1.3，1.4]
2	矩阵	m = [[1,2,3]，[4,5,6]]
3	三阶张量	t = [[[1,2,3]，[4,5,6]]，[[7,8,9]，[10,11,12]]]
n	n阶张量	以此类推......

Tensorflow中用图来表示计算任务，图中的每个节点我们叫它OP，并且每一个OP都可以获得0个以上的tensor，然后执行计算后产生0个或多个tensor；而在计算图的时候为了能够进行计算，必须在会话（session）中启动图，session会将图上的OP分配到CPU、GPU等设备上（我们无需具体的定义使用CPU还是GPU，如果检测到GPU，TensorFlow会用检测到的第一个GPU来执行），同时提供执行OP的方法，执行完成后再将OP返回。

下面用具体的操作来讲解一下每一步的实际应用。

构建并启动图

先上一段代码看一下

import tensorflow as tf

# 此处用来定义OP中的张量
matrix1 = tf.constant([[1, 2, 3]])
matrix2 = tf.constant([[4], [5], [6]])

# 矩阵相乘（执行OP的方法）
Matrix = tf.matmul(matrix1, matrix2)

# 启动默认图（计算图时一定要先启动默认图）
sess = tf.Session()

# 想要执行我们所定义的执行OP的方法，要调用sess中的run函数，返回的是一个numpy `ndarray` 对象
re = sess.run(Matrix)
# 会话完成后要close以释放资源
sess.close()
print(re)

运行结果

瞎聊深度学习——TensorFlow的基本应用_赋值

说明：

这是一段简单的使用TensorFlow计算常量矩阵相乘的代码，在TensorFlow中我们可以使用constant来创建常量OP，需要注意的是在执行OP的时候一定要先启动默认图：session = tf.Session() ，然后使用session.run()执行即可，使用session的run函数的时候就像是我们在使用一种编译器的时候进行编译执行一样。

另一种执行方法：

with tf.Session() as sess:
    re = sess.run(Matrix)
    print(re)

这样做的好处是我们无需再使用close释放资源，在with执行完后会自动进行close操作。

GPU

如果电脑上右多个可用的GPU我们可以用如下的语句来选择GPU

with tf.device("/gpu:1"):
    ......

可以使用：

"/cpu:0" 表示使用第一个cpu

"/gpu:0" 表示使用第一个gpu

以此类推

变量（variable）

变量用来维护图执行过程中的状态信息，例如在神经网络总用于保存和更新神经网络上的参数。

举一个常见的例子，用变量来实现一个计数器，通过assign函数不断的给变量count赋计数后的值即可。

import tensorflow as tf

count = tf.Variable(0)
add = tf.constant(1)
add_one = tf.add(count, add)
# assign函数用于复制操作
update = tf.assign(count, add_one)
# init用于在session中让变量初始化
init = tf.global_variables_initializer()

with tf.Session() as sess:
    sess.run(init)
    for i in range(5):
        result = sess.run(update)
        print(result)

运行结果如下：

瞎聊深度学习——TensorFlow的基本应用_tensorflow_02

Feed和Fetch

Feed主要用于临时替换一个操作的输出结果，我们可以提供feed数据作为run()函数调用的参数，feed只在方法内有效，结束后feed就会消失，常见的一种形式是我们用tf.placeholder()来创建占位符，方便于feed在run()内的赋值。举例如下：

import tensorflow as tf

matrix1 = tf.placeholder(dtype=tf.float32)
matrix2 = tf.placeholder(dtype=tf.float32)

Matrix = tf.multiply(matrix1,matrix2)
with tf.Session() as sess:
    re = sess.run([Matrix],feed_dict={matrix1: [1.2], matrix2: [2.2]})
    print(re)

结果:

瞎聊深度学习——TensorFlow的基本应用_tensorflow_03

要注意一下multiply实现的是元素级别的相乘，两个相乘的数一定要有相同的数据类型，而matmul是矩阵相乘。

在之前的run()操作中，我们每次只返回了一个OP操作的值，Fetch一个可以返回多个OP值得属性。

import tensorflow as tf

num1 = tf.constant(3)
num2 = tf.constant(4)
num3 = tf.constant(5)

count1 = tf.add(num1, num2)
count2 = tf.add(count1, num3)
with tf.Session() as sess:
    re = sess.run([count1, count2])
    print(re)

结果如下：

瞎聊深度学习——TensorFlow的基本应用_矩阵相乘_04