日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Debug Tensorflow: 随着训练进行,内存消耗越来越大

發(fā)布時間:2025/3/12 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Debug Tensorflow: 随着训练进行,内存消耗越来越大 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

環(huán)境

  • ubuntu 18.04
  • Python 3.8
  • TensorFlow-gpu 2.3.1
  • CUDA 11.1
  • Tensorflow-yolov5

問題

內存泄漏。訓練時消耗內存越來越多,直到內存完全被占用,服務器連接被迫斷開。無報錯。正常情況是訓練時,內存不應該增加

解決方案

  • 監(jiān)控linux內存情況

  • 安裝memory-profiler

  • 定位問題所在

  • from memory_profiler import profile fp=open('memory_profiler.log','w+')@profile(stream=fp) def train_step2(self, image_data, target):with tf.GradientTape() as tape:# print(tf.reduce_mean(image_data).numpy(), 'matched', tf.reduce_sum(target[0][:,:,:,:,4]).numpy(), tf.reduce_sum(target[1][:,:,:,:,4]).numpy() , tf.reduce_sum(target[2][:,:,:,:,4]).numpy())image = image_datapred_result = self.model(image, training=True)

  • 修改代碼
    我解決這個問題比較奇怪,刪掉shuffle之后就好了?;蛘哒f解決了絕大部分,后面好像還是會內存泄漏,但只有一點點了,幾十個epoch內存大概上升1%,可以接受。
  • # if shuffle:# dataset = dataset.shuffle(buffer_size=1111, seed=1949)

    其他情況

    keras自帶有問題:https://github.com/tensorflow/tensorflow/issues/32052

    與50位技術專家面對面20年技術見證,附贈技術全景圖

    總結

    以上是生活随笔為你收集整理的Debug Tensorflow: 随着训练进行,内存消耗越来越大的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。