當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Tensorflow Day16 Autoencoder 實作

發(fā)布時間：2025/3/15 编程问答 17 豆豆

生活随笔收集整理的這篇文章主要介紹了 Tensorflow Day16 Autoencoder 實作小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

今日目標(biāo)

實作 Autoencoder
比較輸入以及輸出

Github Ipython Notebook 好讀完整版

實作

定義 weight 以及 bias 函數(shù)

1234	def weight_variable(shape, name): return tf.Variable(tf.truncated_normal(shape = shape, stddev = 0.1), name)def bias_variable(shape, name): return tf.Variable(tf.constant(0.1, shape = shape), name)

autoencoder 架構(gòu)

初步的構(gòu)想是建立一個七層的神經(jīng)網(wǎng)路，在 encoder 維度會從 784 逐步變成 300, 100, 5 (code layer)， decoder 的時候再逐步轉(zhuǎn)回 100, 300, 784．而這個想法在現(xiàn)在對 tensorflow 比較熟悉的情形下是很容易實現(xiàn)的，以下就是我實現(xiàn)的程式碼片段

input -> 784 -> 300 -> 100 -> 5 (code layer) -> 100 -> 300 -> 784 -> output

12345678910111213141516171819

x = tf.placeholder(tf.float32, shape = [None, 784])e_W_1 = weight_variable([784, 300], "e_W_1")e_b_1 = bias_variable([300], "e_b_1")e_layer1 = tf.nn.relu(tf.matmul(x, e_W_1) + e_b_1)e_W_2 = weight_variable([300, 100], "e_W_2")e_b_2 = bias_variable([100], "e_b_2")e_layer2 = tf.nn.relu(tf.matmul(e_layer1, e_W_2) + e_b_2)e_W_3 = weight_variable([100, 20], "e_W_3")e_b_3 = bias_variable([20], "e_b_3")code_layer = tf.nn.relu(tf.matmul(e_layer2, e_W_3) + e_b_3)d_W_1 = weight_variable([20, 100], "d_W_1")d_b_1 = bias_variable([100], "d_b_1")d_layer1 = tf.nn.relu(tf.matmul(code_layer, d_W_1) + d_b_1)d_W_2 = weight_variable([100, 300], "d_W_2")d_b_2 = bias_variable([300], "d_b_2")d_layer2 = tf.nn.relu(tf.matmul(d_layer1, d_W_2) + d_b_2)d_W_3 = weight_variable([300, 784], "d_W_3")d_b_3 = bias_variable([784], "d_b_3")output_layer = tf.nn.relu(tf.matmul(d_layer2, d_W_3) + d_b_3)

loss

loss 函數(shù)我使用了?mean square error，而 optimizer 原本是使用?GradientDescentOptimizer，但是做出來的 decode 結(jié)果變得非常糟糕 (如下)．後來上網(wǎng)搜尋了以後改用?RMSPropOptimizer，以下會隨機選出數(shù)個數(shù)字來看看所做出來的結(jié)果．

123	loss = tf.reduce_mean(tf.pow(output_layer - x, 2))optimizer = tf.train.RMSPropOptimizer(0.01).minimize(loss)init_op = tf.global_variables_initializer()

training

123456789

sess = tf.InteractiveSession()sess.run(init_op)for i in range(20000):batch = mnist.train.next_batch(50) if i%100 == 0:print("step %d, loss %g"%(i, loss.eval(feed_dict={x:batch[0]})))optimizer.run(feed_dict={x: batch[0]}) print("final loss %g" % loss.eval(feed_dict={x: mnist.test.images}))

final loss 0.031768

成果

123456789101112

import numpy as npimport matplotlib.pyplot as plt%matplotlib inlinetrainimg = mnist.train.imagestrainlabel = mnist.train.labelsoutput_nd = output_layer.eval(feed_dict = {x: mnist.train.images})for i in [0, 1, 2, 3, 4]:curr_img = np.reshape(trainimg[i, :], (28, 28)) # 28 by 28 matrix ae_img = np.reshape(output_nd[i,:], (28, 28))curr_label = np.argmax(trainlabel[i, :] ) # Labelplt.matshow(curr_img, cmap=plt.get_cmap('gray'))plt.matshow(ae_img, cmap=plt.get_cmap('gray'))

調(diào)整 code layer 維度

而接下來當(dāng)我想嘗試把 code layer 的維度調(diào)整為 2 維來看看

我們可以發(fā)現(xiàn)完全糊掉了，只用二維來表示輸入數(shù)字是不太夠的．更進(jìn)一步仔細(xì)看 code layer 的值，都已經(jīng)接近零，表示這個網(wǎng)路已經(jīng)算是死掉了，因此還要想想為什麼會造成這樣的結(jié)果．

今日心得

用 tensorflow 實作了 autoencoder，但是在降成兩維的效果並不好，需要再找找看有什麼方法可以幫助解決這個情形， google 上看到說 sparse autoencoder 可能可以幫助這個情形．

原文：?https://blog.c1mone.com.tw/2017/01/02/tensorflow-note-day-18/ 與50位技術(shù)專家面對面20年技術(shù)見證，附贈技術(shù)全景圖

總結(jié)

以上是生活随笔為你收集整理的Tensorflow Day16 Autoencoder 實作的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Autoencoder 详解
下一篇： Tensorflow Day19 Den