當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

经过 8 万画作+人工注释训练，算法学会了赏析名画

發(fā)布時(shí)間：2023/12/10 编程问答 64 豆豆

生活随笔收集整理的這篇文章主要介紹了经过 8 万画作+人工注释训练，算法学会了赏析名画小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

來(lái)源：HyperAI超神經(jīng)本文約2100字，建議閱讀7分鐘AI藝術(shù)評(píng)論家的誕生。

關(guān)鍵詞：視覺(jué)藝術(shù) 圖像理解 ArtEmis 數(shù)據(jù)集

[ 導(dǎo)讀?]藝術(shù)作品往往寄托著作者內(nèi)心的情感，人們欣賞一支樂(lè)曲、一幅畫(huà)作，也會(huì)產(chǎn)生情感共鳴。計(jì)算機(jī)又能否理解藝術(shù)畫(huà)作中的情感？斯坦福大學(xué)的研究團(tuán)隊(duì)正在開(kāi)發(fā)這一算法。

列夫·托爾斯泰說(shuō)過(guò)：「藝術(shù)是一種人類(lèi)活動(dòng)，一個(gè)人通過(guò)某種外在符號(hào)，有意識(shí)地把自己經(jīng)歷過(guò)的感受傳達(dá)給別人，而別人也會(huì)被這些感受所感染，真切地體驗(yàn)到這些感受。」

以藝術(shù)畫(huà)作為例，每一幅作品的背后，都蘊(yùn)藏著畫(huà)家的某種情感。梵高、畢加索等著名畫(huà)家，都曾在不同創(chuàng)作時(shí)期，通過(guò)不同色彩、構(gòu)圖等，表達(dá)自己當(dāng)時(shí)所特有的心境與情緒。

梵高的《向日葵》與畢加索的《老吉他手》

計(jì)算機(jī)能否理解這些藝術(shù)畫(huà)作中所蘊(yùn)含的感情色彩呢？斯坦福大學(xué)的計(jì)算機(jī)科學(xué)研究團(tuán)隊(duì)，收集了一個(gè)名為 ArtEmis 的新數(shù)據(jù)集，包含大量的藝術(shù)畫(huà)作及人工標(biāo)注的相應(yīng)情感體驗(yàn)，并訓(xùn)練出能夠?qū)σ曈X(jué)藝術(shù)產(chǎn)生情感反應(yīng)的計(jì)算機(jī)模型。

理解畫(huà)作，從情感標(biāo)記數(shù)據(jù)集開(kāi)始

WikiArt：線上名畫(huà)博物館?

非營(yíng)利性的志愿項(xiàng)目 WikiArt，自 2010 年上線至今，收錄了來(lái)自世界各地的視覺(jué)藝術(shù)作品，堪稱(chēng)大型線上名畫(huà)博物館。

據(jù)該網(wǎng)站數(shù)據(jù)顯示，截至 2020 年 1 月，該網(wǎng)站共收錄來(lái)自 3293 位藝術(shù)家的 169057 件畫(huà)作，包括 61 個(gè)流派。

WikiArt 主頁(yè)展示，作品可按流派、風(fēng)格、

或藝術(shù)家國(guó)籍、所處年代等分類(lèi)檢索

WikiArt 上面畫(huà)作數(shù)量龐大、分類(lèi)清晰，因此也成為許多 AI 領(lǐng)域研究者用來(lái)訓(xùn)練算法的數(shù)據(jù)集。

2015 年，羅格斯大學(xué)與 Facebook AI 實(shí)驗(yàn)室的研究人員，合作開(kāi)發(fā)了 GAN（生成對(duì)抗網(wǎng)絡(luò)），就在 WikiArt 數(shù)據(jù)上對(duì)其進(jìn)行了訓(xùn)練，讓 GAN 能夠區(qū)分不同風(fēng)格的藝術(shù)。

ArtEmis：誕生于 WikiArt 的新數(shù)據(jù)集?

斯坦福大學(xué)團(tuán)隊(duì)則基于 WikiArt 上的作品，創(chuàng)建了一個(gè)新的視覺(jué)藝術(shù)標(biāo)注數(shù)據(jù)集 ArtEmis。

他們對(duì) WikiArt 上 1119 位藝術(shù)家的 81446 件藝術(shù)作品，一一進(jìn)行了標(biāo)注。這些作品包括從 15 世紀(jì)創(chuàng)作的藝術(shù)作品，到 21 世紀(jì)創(chuàng)作的現(xiàn)代美術(shù)畫(huà)，涵蓋了 27 種藝術(shù)風(fēng)格(抽象、巴洛克、立體主義、印象主義等)和 45 種流派(城市景觀、風(fēng)景、肖像、靜物等)，給觀眾帶來(lái)非常多樣化的視覺(jué)沖擊。

其中，每個(gè)作品要求至少 5 個(gè)標(biāo)注者，寫(xiě)出他們看到這幅畫(huà)作時(shí)的主導(dǎo)情緒，并解釋產(chǎn)生這種情緒的原因。

具體來(lái)說(shuō)，要求標(biāo)注者在觀察一件藝術(shù)品后，先從 8 種基本情緒狀態(tài)（憤怒、厭惡、恐懼、悲傷、娛樂(lè)、敬畏、滿足和興奮）中，選一種自己所感受到的主要情緒，如果以上 8 種情緒都不是，也可以標(biāo)注「其它」。

標(biāo)注了情緒感受之后，標(biāo)注者需要再用文字，進(jìn)一步解釋自己為什么產(chǎn)生這種感覺(jué)，或者為什么沒(méi)有任何強(qiáng)烈的情緒反應(yīng)。

以下為人工標(biāo)注者為畫(huà)作標(biāo)注的情感標(biāo)簽，以及詳細(xì)解釋：

這份標(biāo)注工作最終由亞馬遜眾包平臺(tái)的 6377 名標(biāo)注者完成，總共耗時(shí) 10220 個(gè)小時(shí)。

團(tuán)隊(duì)表示，與其他現(xiàn)有同類(lèi)數(shù)據(jù)集相比，ArtEmis 的標(biāo)注使用了更加豐富、感性且多樣化的語(yǔ)言，這些標(biāo)注形成的語(yǔ)料庫(kù)，共包含了 36347 個(gè)不同的詞語(yǔ)。

ArtEmis 數(shù)據(jù)集

視覺(jué)藝術(shù)的情感標(biāo)記數(shù)據(jù)集

發(fā)布機(jī)構(gòu)：斯坦福大學(xué)，巴黎綜合理工學(xué)院以及阿卜杜拉國(guó)王科技大學(xué)

包含數(shù)量：共 439121?條畫(huà)作標(biāo)注

數(shù)據(jù)格式：csv

數(shù)據(jù)大小：21.8?MB

地址：https://hyper.ai/datasets/14861

一個(gè)可感知情感的算法，是怎樣煉成的

為了讓計(jì)算機(jī)也能夠像人類(lèi)一樣，對(duì)視覺(jué)藝術(shù)產(chǎn)生情感反應(yīng)，并用語(yǔ)言證明產(chǎn)生這些情感的原因，團(tuán)隊(duì)基于這一大規(guī)模數(shù)據(jù)集，訓(xùn)練了一個(gè) Neural Speaker（神經(jīng)表達(dá)者）。

斯坦福大學(xué) HAI 學(xué)院的教授 Guibas 表示，這是計(jì)算機(jī)視覺(jué)領(lǐng)域中一項(xiàng)新的探索。此前經(jīng)典的計(jì)算機(jī)視覺(jué)方法，往往是指出圖像中有哪些內(nèi)容，比如：有三只狗；有人正在喝咖啡……而他們的這項(xiàng)工作，則是定義視覺(jué)藝術(shù)中的情感。

經(jīng)過(guò) ArtEmis 數(shù)據(jù)集訓(xùn)練之后，算法識(shí)別出不同的畫(huà)作中蘊(yùn)含的情感，并自動(dòng)生成了這樣判斷的依據(jù)，示例結(jié)果如下：

論文中介紹了具體訓(xùn)練思路。首先，用 ArtEmis 來(lái)訓(xùn)練模型，實(shí)現(xiàn)藝術(shù)畫(huà)作的情感解釋問(wèn)題。這屬于經(jīng)典的 9 路文本分類(lèi)問(wèn)題，團(tuán)隊(duì)使用基于交叉熵的優(yōu)化，應(yīng)用于從頭開(kāi)始訓(xùn)練的 LSTM 文本分類(lèi)器，同時(shí)也考慮對(duì)為這個(gè)任務(wù)預(yù)訓(xùn)練的 BERT 模型進(jìn)行微調(diào)。

另外，讓計(jì)算機(jī)對(duì)人類(lèi)通常會(huì)對(duì)作品產(chǎn)生的情緒反應(yīng)進(jìn)行預(yù)測(cè)。

為了解決這個(gè)問(wèn)題，團(tuán)隊(duì)將輸出和 ArtEmis 用戶標(biāo)注之間的 KL-分歧最小化，以此對(duì)基于 ImageNet 的預(yù)訓(xùn)練 ResNet32 編碼器進(jìn)行微調(diào)。

對(duì)于給定的一幅畫(huà)作，分類(lèi)器先判斷其傳達(dá)的情感是積極還是消極，再進(jìn)一步判斷具體是哪種情感。

團(tuán)隊(duì)介紹，對(duì)于一幅畫(huà)作，算法不僅能夠感知整體的情感色彩，還能區(qū)分畫(huà)中不同人物的感情。以這幅倫勃朗的《被斬首的圣施洗者約翰》為例，AI 算法不僅捕捉到了被斬首的約翰的痛苦，還感知到了畫(huà)中被獻(xiàn)首的女性莎樂(lè)美的「滿足」。

算法對(duì)《被斬首的圣施洗者約翰》生成的情感標(biāo)注

當(dāng)算法擁有了共情能力

人類(lèi)的情感非常豐富且復(fù)雜微妙，即使是我們?nèi)祟?lèi)自己，也并不能百分之百理解某些藝術(shù)家想要表達(dá)的心情，所以，要讓 AI 精準(zhǔn)地理解藝術(shù)家的意圖，目前必然還存在一定挑戰(zhàn)。

不過(guò)，此次 ArtEmis 數(shù)據(jù)集的發(fā)布，已經(jīng)讓 AI 在處理圖像情感屬性方面，邁出了第一步。

團(tuán)隊(duì)表示，待進(jìn)一步研究與改進(jìn)之后，算法或許能夠感知人類(lèi)的悲歡，藝術(shù)家便可借助算法，評(píng)估自己的作品是否能達(dá)到預(yù)期的情感表達(dá)效果。另外，一旦算法能通人性，人機(jī)交互的過(guò)程也將更加自然、和諧。

新聞來(lái)源：

https://techxplore.com/news/2021-03-artist-intent-ai-emotions-visual.html

數(shù)據(jù)集論文：

https://arxiv.org/pdf/2101.07396.pdf

項(xiàng)目主頁(yè)：

https://www.artemisdataset.org/#videos

編輯：黃繼彥

校對(duì)：林亦霖

總結(jié)

以上是生活随笔為你收集整理的经过 8 万画作+人工注释训练，算法学会了赏析名画的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： UVa - 11988 Broken K
下一篇：网站中毒

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

经过 8 万画作+人工注释训练，算法学会了赏析名画

總結(jié)