當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

基于GAN的动漫头像生成

發(fā)布時間：2023/12/18 编程问答 38 豆豆

生活随笔收集整理的這篇文章主要介紹了基于GAN的动漫头像生成小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

GAN的原理

GAN是一種典型的生成網(wǎng)絡(luò)模型，它類似于編解碼結(jié)構(gòu)，通過訓練，他能夠生成不同于訓練集的各種圖片。

首先先訓練判別器，把真圖通過判別器的輸出和真標簽作損失，把假圖通過判別器的輸出和假標簽作損失，讓它具備判別真圖和假圖的能力。然后再訓練生成器，把生成器生成的假圖通過判別器的輸出和真標簽作損失。經(jīng)過反復的訓練，讓判別器難以分辨生成圖的真假，也就是讓它判別為真或為假的概率各為0.5

數(shù)據(jù)集下載

網(wǎng)上下載的動漫頭像數(shù)據(jù)集有很多不清晰的奇異樣本，對此我做了清洗，剩下的都是符合標準的，可直接下載
百度網(wǎng)盤：https://pan.baidu.com/s/1–zFrJdg1gtW2wJ6wtWQsQ
密碼：bu55

網(wǎng)絡(luò)結(jié)構(gòu)

生成網(wǎng)絡(luò)

相當于一個編碼器

class NetD(nn.Module):# 構(gòu)建一個判別器，相當與一個二分類問題, 生成一個值def __init__(self):super(NetD, self).__init__()ndf = opt.ndfself.main = nn.Sequential(# 輸入96*96*3nn.Conv2d(3, ndf, 5, 3, 1, bias=False),nn.LeakyReLU(negative_slope=0.2, inplace=True),# 輸入32*32*ndfnn.Conv2d(ndf, ndf * 2, 4, 2, 1, bias=False),nn.BatchNorm2d(ndf * 2),nn.LeakyReLU(0.2, True),# 輸入16*16*ndf*2nn.Conv2d(ndf * 2, ndf * 4, 4, 2, 1, bias=False),nn.BatchNorm2d(ndf * 4),nn.LeakyReLU(0.2, True),# 輸入為8*8*ndf*4nn.Conv2d(ndf * 4, ndf * 8, 4, 2, 1, bias=False),nn.BatchNorm2d(ndf * 8),nn.LeakyReLU(0.2, True),# 輸入為4*4*ndf*8nn.Conv2d(ndf * 8, 1, 4, 1, 0, bias=True),nn.Sigmoid() # 分類問題)def forward(self, x):return self.main(x).view(-1)

生成器

相當于一個解碼器

class NetG(nn.Module):# 定義一個生成模型，通過輸入噪聲來產(chǎn)生一張圖片def __init__(self):super(NetG, self).__init__()ngf = opt.ngfself.main = nn.Sequential(# 假定輸入為一張1*1*opt.nz維的數(shù)據(jù)(opt.nz維的向量)nn.ConvTranspose2d(opt.nz , ngf * 8, 4, 1, 0, bias=False),nn.BatchNorm2d(ngf * 8),nn.ReLU(inplace=True),# 輸入一個４*4*ngf*8nn.ConvTranspose2d(ngf * 8, ngf * 4, 4, 2, 1, bias=False),nn.BatchNorm2d(ngf * 4),nn.ReLU(True),# 輸入一個8*8*ngf*4nn.ConvTranspose2d(ngf * 4, ngf * 2, 4, 2, 1, bias=True),nn.BatchNorm2d(ngf * 2),nn.ReLU(True),# 輸入一個16*16*ngf*2nn.ConvTranspose2d(ngf * 2, ngf, 4, 2, 1, bias=False),nn.BatchNorm2d(ngf),nn.ReLU(inplace=True),# 輸入一個32*32*ngfnn.ConvTranspose2d(ngf, 3, 5, 3, 1, bias=False),nn.Tanh()# 輸出一張96*96*3)def forward(self, x):return self.main(x)

GAN網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計要點

1、在D網(wǎng)絡(luò)中用stride卷積(stride>1)代替pooling層，在G網(wǎng)絡(luò)中用conv2d_transpose代替上采樣層
2、在G和D網(wǎng)絡(luò)中直接將BN應(yīng)用到所有層會導致樣本震蕩和模型不穩(wěn)定，通過在G網(wǎng)絡(luò)輸出層和D網(wǎng)絡(luò)輸入層不采用BN層可以有效防止這種現(xiàn)象
3、不使用全連接層作為輸出
4、G網(wǎng)絡(luò)中除了輸出層用tanh激活，其他層都是用ReLu激活
5、D網(wǎng)絡(luò)中都使用LeakyReLu激活

網(wǎng)絡(luò)模型訓練

訓練細節(jié)

1、預(yù)處理環(huán)節(jié)，將圖像scale到tanh的[-1,1]
2、所有的參數(shù)初始化由(0,0.02)的正態(tài)分布中隨機得到
3、LeakyReLu的斜率是0.2(默認)
4、優(yōu)化器Adam的learning rate=0.0002,momentum參數(shù)betas的beta1從0.9降為0.5，beta2默認，防止震蕩和不穩(wěn)定
5、可以G網(wǎng)絡(luò)訓練1次，然后D網(wǎng)絡(luò)訓練1次，如此反復；也可以G網(wǎng)絡(luò)先訓練幾次后，D網(wǎng)絡(luò)再訓練1次，如此反復。前者效果出得較快，后者較慢。
訓練代碼

# opt參數(shù) ngf=96 ndf=96 nz=256 img_size=96 batch_size=100 num_workers=4 netg_path=r"網(wǎng)絡(luò)參數(shù)/netg_5.pt" netd_path=r"網(wǎng)絡(luò)參數(shù)/netd_5.pt" lr1=0.0002 lr2=0.0002 beta1=0.5 epochs=200 d_every=1 g_every=5 save_every=20 from torchvision.utils import save_image import Nets import torch from torch.utils.data import DataLoader import opt import torch.nn as nn import datasetif __name__=="__main__":# 1. 加載數(shù)據(jù)dataset = dataset.Dataset()dataloader = DataLoader(dataset,batch_size=opt.batch_size,shuffle=True,num_workers=opt.num_workers,drop_last=True)# 2．初始化網(wǎng)絡(luò)netg, netd = Nets.NetG(), Nets.NetD()# 3. 設(shè)定優(yōu)化器參數(shù)optimize_g = torch.optim.Adam(netg.parameters(), lr=opt.lr1, betas=(opt.beta1,0.999))optimize_d = torch.optim.Adam(netd.parameters(), lr=opt.lr2, betas=(opt.beta1,0.999))loss_func = nn.BCELoss()# 4. 定義標簽, 并且開始注入生成器的輸入noisetrue_labels = torch.ones(opt.batch_size)fake_labels = torch.zeros(opt.batch_size)noises = torch.randn(opt.batch_size, opt.nz, 1, 1)# 6.訓練網(wǎng)絡(luò)netg.train()netd.train()for epoch in range(opt.epochs):for i, img in enumerate(dataloader):real_img = img# 訓練判別器if i % opt.d_every == 0:optimize_d.zero_grad()# 真圖real_out = netd(real_img)error_d_real = loss_func(real_out, true_labels)error_d_real.backward()# 隨機生成的假圖noises = noises.detach()fake_image = netg(noises).detach()fake_out = netd(fake_image)error_d_fake = loss_func(fake_out, fake_labels)error_d_fake.backward()optimize_d.step()# 計算losserror_d = error_d_fake + error_d_realprint("第{0}輪：判別網(wǎng)絡(luò) 損失:{1} 對真圖評分:{2} 對生成圖評分:{3}".format(epoch+1,error_d.item(),real_out.data.mean(),fake_out.data.mean()))# 訓練生成器if i % opt.g_every == 0 and i>0:optimize_g.zero_grad()noises.data.copy_(torch.randn(opt.batch_size, opt.nz, 1, 1))fake_img = netg(noises)output = netd(fake_img)error_g = loss_func(output, true_labels)error_g.backward()optimize_g.step()print(" 生成網(wǎng)絡(luò) 損失:{0}".format(error_g.item()))# 7.保存模型和圖片if i % opt.save_every == 0 and i>0:fix_noises = torch.randn(opt.batch_size, opt.nz, 1, 1)fix_fake_image = netg(fix_noises)# save_image(real_img.data*0.5+0.5, "./img/{0}-{1}-real_img.jpg".format(epoch, i), nrow=10)save_image(fix_fake_image.data*0.5+0.5, "./image/{0}-{1}-fake_img.jpg".format(epoch, i), nrow=10)torch.save(netd.state_dict(), opt.netd_path)torch.save(netg.state_dict(), opt.netg_path)

效果展示

生成網(wǎng)絡(luò)隨機生成的頭像

總結(jié)

以上是生活随笔為你收集整理的基于GAN的动漫头像生成的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：破解握手包
下一篇： ssh 工具 socket 10106