日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

使用PyTorch训练图像分类器

發布時間:2025/3/21 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 使用PyTorch训练图像分类器 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

訓練分類器

2019年年初,ApacheCN組織志愿者翻譯了PyTorch1.0版本中文文檔(github地址),同時也獲得了PyTorch官方授權,我相信已經有許多人在中文文檔官網上看到了。不過目前校對還缺人手,希望大家踴躍參與。之前一段時間我們和PyTorch的有關負責人Bruce Lin一直在進行郵件交流。在之后適當的時候,我們會組織志愿者進行其他有關PyTorch的項目,歡迎大家加入我們,關注我們。更希望我們的一系列工作能夠對大家有所幫助。

譯者:bat67

校對者:FontTian

目前為止,我們以及看到了如何定義網絡,計算損失,并更新網絡的權重。所以你現在可能會想,

數據應該怎么辦呢?

通常來說,當必須處理圖像、文本、音頻或視頻數據時,可以使用python標準庫將數據加載到numpy數組里。然后將這個數組轉化成torch.*Tensor。

  • 對于圖片,有Pillow,OpenCV等包可以使用
  • 對于音頻,有scipy和librosa等包可以使用
  • 對于文本,不管是原生python的或者是基于Cython的文本,可以使用NLTK和SpaCy

特別對于視覺方面,我們創建了一個包,名字叫torchvision,其中包含了針對Imagenet、CIFAR10、MNIST等常用數據集的數據加載器(data loaders),還有對圖片數據變形的操作,即torchvision.datasets和torch.utils.data.DataLoader。

這提供了極大的便利,可以避免編寫樣板代碼。

在這個教程中,我們將使用CIFAR10數據集,它有如下的分類:“飛機”,“汽車”,“鳥”,“貓”,“鹿”,“狗”,“青蛙”,“馬”,“船”,“卡車”等。在CIFAR-10里面的圖片數據大小是3x32x32,即三通道彩色圖,圖片大小是32x32像素。

訓練一個圖片分類器

我們將按順序做以下步驟:

  • 通過torchvision加載CIFAR10里面的訓練和測試數據集,并對數據進行標準化
  • 定義卷積神經網絡
  • 定義損失函數
  • 利用訓練數據訓練網絡
  • 利用測試數據測試網絡
  • 1.加載并標準化CIFAR10

    使用torchvision加載CIFAR10超級簡單。

    import torch import torchvision import torchvision.transforms as transforms

    torchvision數據集加載完后的輸出是范圍在[0, 1]之間的PILImage。我們將其標準化為范圍在[-1, 1]之間的張量。

    transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform) trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True, num_workers=2)testset = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transform) testloader = torch.utils.data.DataLoader(testset, batch_size=4, shuffle=False, num_workers=2)classes = ('plane', 'car', 'bird', 'cat','deer', 'dog', 'frog', 'horse', 'ship', 'truck')

    輸出:

    Downloading https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz to ./data/cifar-10-python.tar.gz Files already downloaded and verified

    樂趣所致,現在讓我們可視化部分訓練數據。

    import matplotlib.pyplot as plt import numpy as np# 輸出圖像的函數def imshow(img):img = img / 2 + 0.5 # unnormalizenpimg = img.numpy()plt.imshow(np.transpose(npimg, (1, 2, 0)))plt.show()# 隨機獲取訓練圖片 dataiter = iter(trainloader) images, labels = dataiter.next()# 顯示圖片 imshow(torchvision.utils.make_grid(images)) # 打印圖片標簽 print(' '.join('%5s' % classes[labels[j]] for j in range(4)))

    輸出:

    horse horse horse car

    2.定義卷積神經網絡

    將之前神經網絡章節定義的神經網絡拿過來,并將其修改成輸入為3通道圖像(替代原來定義的單通道圖像)。

    import torch.nn as nn import torch.nn.functional as Fclass Net(nn.Module):def __init__(self):super(Net, self).__init__()self.conv1 = nn.Conv2d(3, 6, 5)self.pool = nn.MaxPool2d(2, 2)self.conv2 = nn.Conv2d(6, 16, 5)self.fc1 = nn.Linear(16 * 5 * 5, 120)self.fc2 = nn.Linear(120, 84)self.fc3 = nn.Linear(84, 10)def forward(self, x):x = self.pool(F.relu(self.conv1(x)))x = self.pool(F.relu(self.conv2(x)))x = x.view(-1, 16 * 5 * 5)x = F.relu(self.fc1(x))x = F.relu(self.fc2(x))x = self.fc3(x)return xnet = Net()

    3.定義損失函數和優化器

    我們使用分類的交叉熵損失和隨機梯度下降(使用momentum)。

    import torch.optim as optimcriterion = nn.CrossEntropyLoss() optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

    4.訓練網絡

    事情開始變得有趣了。我們只需要遍歷我們的數據迭代器,并將輸入“喂”給網絡和優化函數。

    for epoch in range(2): # loop over the dataset multiple timesrunning_loss = 0.0for i, data in enumerate(trainloader, 0):# get the inputsinputs, labels = data# zero the parameter gradientsoptimizer.zero_grad()# forward + backward + optimizeoutputs = net(inputs)loss = criterion(outputs, labels)loss.backward()optimizer.step()# print statisticsrunning_loss += loss.item()if i % 2000 == 1999: # print every 2000 mini-batchesprint('[%d, %5d] loss: %.3f' % (epoch + 1, i + 1, running_loss / 2000))running_loss = 0.0print('Finished Training')

    輸出:

    [1, 2000] loss: 2.182 [1, 4000] loss: 1.819 [1, 6000] loss: 1.648 [1, 8000] loss: 1.569 [1, 10000] loss: 1.511 [1, 12000] loss: 1.473 [2, 2000] loss: 1.414 [2, 4000] loss: 1.365 [2, 6000] loss: 1.358 [2, 8000] loss: 1.322 [2, 10000] loss: 1.298 [2, 12000] loss: 1.282 Finished Training

    5.使用測試數據測試網絡

    我們已經在訓練集上訓練了2遍網絡。但是我們需要檢查網絡是否學到了一些東西。

    我們將通過預測神經網絡輸出的標簽來檢查這個問題,并和正確樣本進行(ground-truth)對比。如果預測是正確的,我們將樣本添加到正確預測的列表中。

    ok,第一步。讓我們顯示測試集中的圖像來熟悉一下。

    dataiter = iter(testloader) images, labels = dataiter.next()# 輸出圖片 imshow(torchvision.utils.make_grid(images)) print('GroundTruth: ', ' '.join('%5s' % classes[labels[j]] for j in range(4)))

    GroundTruth: cat ship ship plane

    ok,現在讓我們看看神經網絡認為上面的例子是:

    outputs = net(images)

    輸出是10個類別的量值。一個類的值越高,網絡就越認為這個圖像屬于這個特定的類。讓我們得到最高量值的下標/索引;

    _, predicted = torch.max(outputs, 1)print('Predicted: ', ' '.join('%5s' % classes[predicted[j]] for j in range(4)))

    輸出:

    Predicted: dog ship ship plane

    結果還不錯。

    讓我們看看網絡在整個數據集上表現的怎么樣。

    correct = 0 total = 0 with torch.no_grad():for data in testloader:images, labels = dataoutputs = net(images)_, predicted = torch.max(outputs.data, 1)total += labels.size(0)correct += (predicted == labels).sum().item()print('Accuracy of the network on the 10000 test images: %d %%' % (100 * correct / total))

    輸出:

    Accuracy of the network on the 10000 test images: 55 %

    這比隨機選取(即從10個類中隨機選擇一個類,正確率是10%)要好很多。看來網絡確實學到了一些東西。

    那么哪些是表現好的類呢?哪些是表現的差的類呢?

    class_correct = list(0. for i in range(10)) class_total = list(0. for i in range(10)) with torch.no_grad():for data in testloader:images, labels = dataoutputs = net(images)_, predicted = torch.max(outputs, 1)c = (predicted == labels).squeeze()for i in range(4):label = labels[i]class_correct[label] += c[i].item()class_total[label] += 1for i in range(10):print('Accuracy of %5s : %2d %%' % (classes[i], 100 * class_correct[i] / class_total[i]))

    輸出:

    Accuracy of plane : 70 % Accuracy of car : 70 % Accuracy of bird : 28 % Accuracy of cat : 25 % Accuracy of deer : 37 % Accuracy of dog : 60 % Accuracy of frog : 66 % Accuracy of horse : 62 % Accuracy of ship : 69 % Accuracy of truck : 61 %

    ok,接下來呢?

    怎么在GPU上運行神經網絡呢?

    在GPU上訓練

    與將一個張量傳遞給GPU一樣,可以這樣將神經網絡轉移到GPU上。

    如果我們有cuda可用的話,讓我們首先定義第一個設備為可見cuda設備:

    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")# Assuming that we are on a CUDA machine, this should print a CUDA device:print(device)

    輸出:

    cuda:0

    本節的其余部分假設device是CUDA。

    然后這些方法將遞歸遍歷所有模塊,并將它們的參數和緩沖區轉換為CUDA張量:

    net.to(device)

    請記住,我們不得不將輸入和目標在每一步都送入GPU:

    inputs, labels = inputs.to(device), labels.to(device)

    為什么我們感受不到與CPU相比的巨大加速?因為我們的網絡實在是太小了。

    嘗試一下:加寬你的網絡(注意第一個nn.Conv2d的第二個參數和第二個nn.Conv2d的第一個參數要相同),看看能獲得多少加速。

    已實現的目標:

    • 在更高層次上理解PyTorch的Tensor庫和神經網絡
    • 訓練一個小的神經網絡做圖片分類

    在多GPU上訓練

    如果希望使用您所有GPU獲得更大的加速,請查看Optional: Data Parallelism。

    接下來要做什么?

    • Train neural nets to play video games
    • Train a state-of-the-art ResNet network on imagenet
    • Train a face generator using Generative Adversarial Networks
    • Train a word-level language model using Recurrent LSTM networks
    • More examples
    • More tutorials
    • Discuss PyTorch on the Forums
    • Chat with other users on Slack
      l using Recurrent LSTM networks](https://github.com/pytorch/examples/tree/master/word_language_model)
    • More examples
    • More tutorials
    • Discuss PyTorch on the Forums
    • Chat with other users on Slack

    總結

    以上是生活随笔為你收集整理的使用PyTorch训练图像分类器的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。