TensorFlow学习笔记(二十二) tensorflow数据读取方法总结
本文PDF文件下載地址:http://download.csdn.net/download/qq_36330643/9938438
Tensorflow的數據讀取有三種方式:
1. Preloaded data: 預加載數據 。
2. Feeding: Python產生數據,再把數據喂給后端。
3. Reading from file: 從文件中直接讀取。
這三種有讀取方式有什么區別呢? 我們首先要知道TensorFlow(TF)是怎么樣工作的。
TF的核心是用C++寫的,這樣的好處是運行快,缺點是調用不靈活。而Python恰好相反,所以結合兩種語言的優勢。涉及計算的核心算子和運行框架是用C++寫的,并提供API給Python。Python調用這些API,設計訓練模型(Graph),再將設計好的Graph給后端去執行。簡而言之,Python的角色是Design,C++是Run。
1. Preload
import tensorflow as tf
a = tf.constant(5, name="input_a")
b = tf.constant(3, name="input_b")
sess = tf.Session()
sess.run(a)
c = tf.multiply(a,b, name="mul_c")
d = tf.add(a,b, name="add_d")
print(c)
e = tf.add(c,d, name="add_e")
print(e)
sess = tf.Session()
output = sess.run(e)
print(a)
print(output)
sess.close()
2. Feeding
import tensorflow as tf
import numpy as np
a = tf.placeholder(tf.int32,shape=[2],name="my_input")
b = tf.reduce_prod(a,name="prod_b")
c = tf.reduce_sum(a,name="sum_c")
d = tf.add(b,c,name="add-d")
sess = tf.Session()
input_dict = {a:np.array([5,3],dtype=np.int32)}
output = sess.run(d,feed_dict=input_dict)
print(output)
sess.run()中的feed_dict參數,將Python產生的數據喂給后端,并計算output。
以上兩種方法的區別 Preload: 將數據直接內嵌到Graph中,再把Graph傳入Session中運行。當數據量比較大時,Graph的傳輸會遇到效率問題。 Feeding: 用占位符替代數據,待運行的時候填充數據。
3. Reading From File
前兩種方法很方便,但是遇到大型數據的時候就會很吃力,即使是Feeding,中間環節的增加也是不小的開銷,比如數據類型轉換等等。最優的方案就是在Graph定義好文件讀取的方法,讓TF自己去從文件中讀取數據,并解碼成可使用的樣本集。
在上圖中,首先由一個單線程把文件名堆入隊列,兩個Reader同時從隊列中取文件名并讀取數據,Decoder將讀出的數據解碼后堆入樣本隊列,最后單個或批量取出樣本(圖中沒有展示樣本出列)。我們這里通過三段代碼逐步實現上圖的數據流,這里我們不使用隨機,讓結果更清晰。
下面部分由于敲字慢,全部采用圖片了。
總結
以上是生活随笔為你收集整理的TensorFlow学习笔记(二十二) tensorflow数据读取方法总结的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: TensorFlow学习笔记(二十一)
- 下一篇: TensorFlow学习笔记(二十四)自