1200字范文 > 【Tensorflow学习三】神经网络搭建八股“六步法”编写手写数字识别训练模型

【Tensorflow学习三】神经网络搭建八股“六步法”编写手写数字识别训练模型

时间：2018-10-14 11:49:55

神经网络搭建八股“六步法”编写手写数字识别训练模型

Sequential用法pile(optimizer=优化器,loss=损失函数,metrics=["准确率"])model.fitmodel.summery六步法搭建鸢尾花分类网络class搭建具有非顺序网络结构MNIST数据集Fashion MNIST数据集

用TensorflowAPI:tf.keras搭建网络八股

六步法

1.import (import相关模块，比如import tensorflow as tf)2.train test (喂入网络的训练集和测试集，指定训练集的输入特征x_train和训练集的标签y_train ，还可以指定测试集的输入特征x_test和测试集的标签y_test)3.model=tf.keras.models.Sequential (搭建网络结构，逐层描述每层网络)pile (配置训练方法，告知训练时选择哪种优化器、损失函数、评测指标)5.model.fit (执行训练过程，告知训练集和测试集的输入特征和标签，告知每个batch是多少、要迭代多少次数据集)6.model.summary (打印网络的结构和参数统计)

Sequential用法

可以认为Sequential()是个容器，在这个容器中封装了一个神经网络结构

在Sequential要描述从输入层到输出层每一层的网络结构

例如：

1.拉直层：tf.keras.layers.Flatten()2.全连接层：tf.keras.layers.Dense(神经元个数,activation='激活函数',kernel_regularizer=哪种正则化)activation可选:relu、softmax、sigmoid、tanhkernel_regularizer可选:tf.keras.regularizers.l1()、tf.keras.regularizers.l2()3.卷积层:tf.keras.Conv2D(filter=卷积核个数,kernel_size=卷积核尺寸,strides=卷积步长,padding="valid" or "same")4.LSTM层：tf.keras.layers.LSTM()

pile(optimizer=优化器,loss=损失函数,metrics=[“准确率”])

optimizer可选：

#优化器，可以是字符串形式的名字,还可以是函数形式(函数形式可以设置学习率、动量等超参数)"sgd" or tf.keras.optimizers.SGD(lr=学习率,momentum=动量参数)"adagrad" or tf.keras.optimizers.Adagrad(lr=学习率)"adadelta" or tf.keras.optimizers.Adadelta(lr=学习率)"adam" or tf.keras.optimizers.Adam(lr=学习率,beta_1=0.9,beta_2=0.999)

loss可选：

#优损失函数，可以是字符串形式的名字,还可以是函数形式"mse" or tf.keras.losses.MeanSquaredError()"sparse_categorical_crossentropy" or tf.keras.SparseCategoricalCrossentropy(from_logits=False)#from_logits=False 询问是否是原始输出(指未经过softmax概率输出的，经过False,未经过True)

Metrics可选：

"accuracy":y_和y都是值"categorical_accuracy":y与y_都是独热码"sparse_categorical":y_是值，y是独热码

model.fit

modelfit(训练集输入特征,训练集的标签，batch_size= , epochs= ,validation_data=(测试集的输入特征,测试集的标签)vaildation_split=从训练集划分多少比例给测试集vaildation_freq=多少epoch测试一次)#validation_data与vaildation_split二选一

model.summery

model.summery可以打印网络的结构和参数统计

以鸢尾花分类的网络为例

六步法搭建鸢尾花分类网络

import tensorflow as tffrom sklearn import datasetsimport numpy as npx_train = datasets.load_iris().datay_train = datasets.load_iris().targetnp.random.seed(116)np.random.shuffle(x_train)np.random.seed(116)np.random.shuffle(y_train)tf.random.set_seed(116)model = tf.keras.models.Sequential([tf.keras.layers.Dense(3, activation='softmax', kernel_regularizer=tf.keras.regularizers.l2())])pile(optimizer=tf.keras.optimizers.SGD(lr=0.1),loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),metrics=['sparse_categorical_accuracy'])model.fit(x_train, y_train, batch_size=32, epochs=500, validation_split=0.2, validation_freq=20)model.summary()

class搭建具有非顺序网络结构

#想要搭建非顺序的网络结构，可以用class1.import 2.train、test3.class MyModel(model) model=pile5.model.fit6.model.sunmmary

用class类来封装一个网络结构

class MyModel(Model)

class MyModel(Model):#MyModel为神经网络的名字，继承了Tensorflow的Model类def __init__(self):super(MyModel,self).__init__()定义网络结构模块def call(self,x):调用网络结构模块，实现前向传播return ymodel=MyModel()###__init__() 定义所需的网络结构块call() 写出前向传播###

例子：

class IrisModel(Model):def __init__(self):supper(IrisModel,self).__init__()self.d1=Dens(3)def call(self,x):y=self.d1(x)return ymodel=IrisModel()

用类实网络结构实现鸢尾花分类的代码：

import tensorflow as tffrom tensorflow.keras.layers import Dense#添加的部分from tensorflow.keras import Model#添加的部分import numpy as npfrom sklearn import datasetsx=datasets.load_iris().datay=datasets.load_iris().targetnp.random.seed(116)np.random.shuffle(x)np.random.seed(116)np.random.shuffle(y)class IrisModel(Model):def __init__(self):super().__init__()self.d1=Dense(3,activation='sigmoid',kernel_regularizer=tf.keras.regularizers.l2())def call(self,x):y=self.d1(x)return ymodel=IrisModel()# model=tf.keras.models.Sequential([tf.keras.layers.Dense(3,activation="softmax",kernel_regularizer=tf.keras.regularizers.l2())])pile(optimizer=tf.keras.optimizers.SGD(learning_rate=0.1),loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),metrics=['sparse_categorical_accuracy'])model.fit(x,y,batch_size=32,epochs=500,validation_split=0.2,validation_freq=20)model.summary()

结果为

Epoch 500/5004/4 [==============================] - 0s 11ms/step- loss: 0.4527 - sparse_categorical_accuracy: 0.8500 - val_loss: 1.0348 - val_sparse_categorical_accuracy: 0.5333Model: "iris_model"____________________________________________________________Layer (type)Output Shape Param ============================================================dense (Dense)multiple 15 ============================================================Total params: 15Trainable params: 15Non-trainable params: 0____________________________________________________________

其中:

loss：训练集lossval_loss：测试集losssparse_categorical_accuracy：训练集准确率val_sparse_categorical_accuracy：测试集准确率

MNIST数据集

MNIST数据集提供6w张 28*28像素的0~9手写数字图片和标签，用于训练提供1w张 28*28像素的0~9手写数字图片和标签，用于测试导入数据集：minist=tf.keras.datasets.mnist(x_train,y_train),(x_test,y_test)=mnist.load_data()作为输入特征，输入神经网络时，将数据拉伸为一维tf.keras.layers.Flatten()

import tensorflow as tffrom matplotlib import pyplot as pltmnist = tf.keras.datasets.mnist(x_train, y_train), (x_test, y_test) = mnist.load_data(r"这里填mnist数据集路径")#把minist数据集先下载到电脑中，再导入，直接下载容易出错# 可视化训练集输入特征的第一个元素plt.imshow(x_train[0], cmap='gray') # 绘制灰度图plt.show()# 打印出训练集输入特征的第一个元素print("x_train[0]:\n", x_train[0])# 打印出训练集标签的第一个元素print("y_train[0]:\n", y_train[0])# 打印出整个训练集输入特征形状print("x_train.shape:\n", x_train.shape)# 打印出整个训练集标签的形状print("y_train.shape:\n", y_train.shape)# 打印出整个测试集输入特征的形状print("x_test.shape:\n", x_test.shape)# 打印出整个测试集标签的形状print("y_test.shape:\n", y_test.shape)

用mnist数据集的训练代码

import tensorflow as tfmnist=tf.keras.datasets.mnist(x_train,y_train),(x_test,y_test)=mnist.load_data(r"这里填mnist数据集路径")x_train,x_test=x_train/255.0,x_test/255.0#归一化到[0,1]model=tf.keras.models.Sequential([tf.keras.layers.Flatten(),tf.keras.layers.Dense(128,activation='relu'),tf.keras.layers.Dense(10,activation='softmax')])pile(optimizer='adam',loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),metrics=["sparse_categorical_accuracy"])model.fit(x_train,y_train,batch_size=32,epochs=5,validation_data=(x_test,y_test),validation_freq=1)#执行训练过程model.summary()

用类实现手写字识别

import tensorflow as tffrom tensorflow.keras.layers import Dense,Flattenfrom tensorflow.keras import Modelmnist=tf.keras.datasets.mnist(x_train,y_train),(x_test,y_test)=mnist.load_data(r"C:\Users\98306\Desktop\Tensorflow\中国大学MOOCTF笔记2.1共享给所有学习者\class3\mnist.npz")x_train,x_test=x_train/255.0,x_test/255.0 #归一化到[0,1]class MnistModel(Model):def __init__(self):super(MnistModel, self).__init__()self.flatten=Flatten()self.d1=Dense(128,activation='relu')self.d2=Dense(10,activation='softmax')def call(self,x):x=self.flatten(x)x=self.d1(x)y=self.d2(x)return ymodel=MnistModel()# model=tf.keras.models.Sequential([#tf.keras.layers.Flatten(),#tf.keras.layers.Dense(128,activation='relu'),#tf.keras.layers.Dense(10,activation='softmax')# ])pile(optimizer='adam',loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),metrics=["sparse_categorical_accuracy"])model.fit(x_train,y_train,batch_size=32,epochs=5,validation_data=(x_test,y_test),validation_freq=1)model.summary()

Fashion MNIST数据集

Fashion MNIST数据集提供6w张 28*28像素的0~9手写衣服裤子等图片和标签，用于训练提供1w张 28*28像素的0~9手写衣服裤子等图片和标签，用于测试一共十个分类导入数据集：minist=tf.keras.datasets.mnist(x_train,y_train),(x_test,y_test)=mnist.load_data()作为输入特征，输入神经网络时，将数据拉伸为一维tf.keras.layers.Flatten()

Fashion MNIST数据集没法直接代码下载的话可以参考这篇博客

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。