线性模型

原创

青山新雨 2023-05-21 01:35:57 ©著作权

文章标签 数据神经网络 tensorflow 文章分类 jQuery 前端开发

©著作权归作者所有：来自51CTO博客作者青山新雨的原创作品，请联系作者获取转载授权，否则将追究法律责任

import tensorflow as tf
from numpy.random import RandomState

#定义训练数据batch的大小
batch_size=8

#定义神经网络的参数
w1=tf.Variable(tf.random_normal([2,3], stddev=1, seed=1))
w2=tf.Variable(tf.random_normal([3,1], stddev=1, seed=1))

#在shape的一个维度上使用None可以方便使用不大的batch大小，在训练时需要把数据分为
#较小的batch，但是在测试时，可以一次性使用全部数据。
x=tf.placeholder(tf.float32,shape=(None, 2), name="x-input")
y_=tf.placeholder(tf.float32, shape=(None,1), name="y-input")

#定义神经网络的前向传播过程
a=tf.matmul(x, w1)
y=tf.matmul(a, w2)

#定义损失函数
cross_entropy=-tf.reduce_mean(y_*tf.log(tf.clip_by_value(y,1e-10,1.0)))
#定义反向传播算法
train_step=tf.train.AdamOptimizer(0.001).minimize(cross_entropy)

#通过随机数产生一个模拟数据集
rdm=RandomState(1)
dataset_size=128
X=rdm.rand(dataset_size, 2)

#定义规则来给出样本的标签。
#定义x1+x2<1的样例被认为是正样本。其他情况为负样本
Y=[[int(x1+x2<1)]for(x1,x2) in X]

#创建一个会话来运行tensorflow程序
with tf.Session() as sess:
    #初始化——start——
    init_op=tf.initialize_all_variables()
    sess.run(init_op)
    #初始化——end——

    #输出原始参数值
    print("输出初始参数：")
    print(sess.run(w1))
    print(sess.run(w2))

    #训练——start——
    STEPS=5000
    for i in range(STEPS):
        '''每次选出batch_size个样本进行训练'''
        start=(i*batch_size)%dataset_size
        end=min(start+batch_size, dataset_size)

        #通过选出的样本训练神经网络并更新参数
        sess.run(train_step,
                 feed_dict={x:X[start:end],y_:Y[start:end]})
        if i%1000==0 :
            '''每隔一段时间计算在所有数据上的交叉熵并输出'''
            total_cross_entropy=sess.run(cross_entropy,feed_dict={x:X,y_:Y})
            print("-----------------------")
            print("在%d训练步后，所有数据的交叉熵是%g"%(i,total_cross_entropy))
            print("-----------------------")
        print("第%d轮->"%(i))
        print("参数w1:")
        print(sess.run(w1))
        print("参数w2:")
        print(sess.run(w2))