“天猫精灵”如何为你写诗?人机共创的秘密在这儿
?
阿里妹導(dǎo)讀:在AlphaGo人機(jī)大戰(zhàn)之后,AI在模仿學(xué)習(xí)人的能力上得到了關(guān)注。同時(shí),一種焦慮也在人們心中蔓延,我們的工作何時(shí)會(huì)被AI替代?
阿里巴巴人工智能實(shí)驗(yàn)室用好玩的“天貓精靈寫(xiě)詩(shī)”告訴我們實(shí)現(xiàn)人機(jī)共創(chuàng)的可能,接下來(lái),我們一起了解七夕節(jié),天貓精靈花式表白背后的技術(shù)。
今年七夕期間,由阿里巴巴人工智能實(shí)驗(yàn)室(A.I.Labs)AI創(chuàng)作團(tuán)隊(duì)研發(fā)的《天貓精靈為你寫(xiě)詩(shī)》(以下簡(jiǎn)稱“為你寫(xiě)詩(shī)”),通過(guò)它,你可以用AI給心愛(ài)的人寫(xiě)一首藏頭情詩(shī),還可以進(jìn)行人機(jī)共創(chuàng)的合作。
今天,我們對(duì)AI創(chuàng)作團(tuán)隊(duì)負(fù)責(zé)人進(jìn)行了專訪。該團(tuán)隊(duì)在A.I.Labs的認(rèn)知實(shí)驗(yàn)室負(fù)責(zé)探索AI智能創(chuàng)作、深度學(xué)習(xí)、自然語(yǔ)言理解、智能對(duì)話等人工智能技術(shù)在智能音箱上的應(yīng)用。
?
訪問(wèn):https://poem.jhgtgb.com/index?referer=4
即可親身體驗(yàn)A.I.幫你寫(xiě)詩(shī)~
如何實(shí)現(xiàn)古詩(shī)創(chuàng)作中的人機(jī)共創(chuàng)?
Q:為什么想到從AI寫(xiě)詩(shī)這個(gè)角度切入,去做人機(jī)共創(chuàng)?
A:在文藝創(chuàng)作這件事情上,我們認(rèn)為最重要的不是智能,人機(jī)共創(chuàng)才能將“智能”與“情感”的結(jié)合推向一個(gè)更高的高度,讓創(chuàng)作更具“心智”和“情感”才是更重要的。在人機(jī)共創(chuàng)的過(guò)程中,機(jī)器也可能會(huì)越來(lái)越多地了解“情感”的表達(dá)。為印證人機(jī)共創(chuàng)的價(jià)值,我們做了“天貓精靈為你寫(xiě)詩(shī)”的嘗試。
?
Q:“為你寫(xiě)詩(shī)”人機(jī)共創(chuàng)的部分是如何實(shí)現(xiàn)的?
A:人機(jī)共創(chuàng)的模式是機(jī)器為人提供推薦,而不是讓人獨(dú)自去完成修改。例如,詩(shī)句生成模型在每一句詩(shī)的每一個(gè)字都可以提供候選集,還可以通過(guò)beam search固定一部分文字生成后序的文字等等。
但是,單句或者單字的修改其實(shí)是會(huì)影響整首詩(shī)的質(zhì)量的,如果只修改一句,不能對(duì)后續(xù)詩(shī)句做相應(yīng)的推薦則不能發(fā)揮人機(jī)共創(chuàng)的優(yōu)勢(shì),針對(duì)這個(gè)問(wèn)題我們給出了一個(gè)解決方案:
我們?cè)诮^句的生成過(guò)程中保一個(gè)位留了每置詩(shī)句的不同表達(dá),然后再選擇匹配句子,通過(guò)統(tǒng)一的評(píng)價(jià)模型來(lái)衡量不同的佳句組合的質(zhì)量,從中選擇最具品質(zhì)的作為輸出。
Q:如何構(gòu)建人機(jī)共創(chuàng)的評(píng)價(jià)模型呢?
?
前序詩(shī)句的bigram詞袋經(jīng)過(guò)嵌入層之后再經(jīng)過(guò)全鏈接網(wǎng)絡(luò)對(duì)后一句打分,這個(gè)分?jǐn)?shù)可以看作是對(duì)每一邊的評(píng)分,而整詩(shī)的評(píng)分就是所有邊評(píng)分個(gè)乘積。評(píng)分模型可以通過(guò)在古詩(shī)訓(xùn)練集上學(xué)習(xí),同時(shí)在使用過(guò)程中很容易通過(guò)對(duì)計(jì)算的緩存來(lái)加速。
整個(gè)搜索的過(guò)程是一個(gè)求出最大K路徑的問(wèn)題,每一個(gè)路徑的打分則通過(guò)評(píng)分模型完成。搜索過(guò)程中,通過(guò)剪枝來(lái)去除壓韻和平仄不相符的路徑,最終按照評(píng)分排序得到最佳絕句。
這個(gè)過(guò)程可以從任意一句詩(shī)開(kāi)始,當(dāng)其中一句詩(shī)被修改之后,就可以從它開(kāi)始重新構(gòu)建整棵樹(shù),然后根據(jù)評(píng)價(jià)模型的結(jié)果來(lái)推薦后續(xù)詩(shī)句。
讓機(jī)器寫(xiě)詩(shī)變得更優(yōu)秀
Q:在寫(xiě)詩(shī)這件事上,“為你寫(xiě)詩(shī)”如何做到人有我優(yōu)?
A:從寫(xiě)一句詩(shī)到寫(xiě)兩句詩(shī)的最大挑戰(zhàn)在于如何讓兩句詩(shī)的語(yǔ)境相連,也就是說(shuō)在寫(xiě)第二句詩(shī)的時(shí)候機(jī)器需要知道第一句詩(shī)在說(shuō)些什么,并且承前啟后。
語(yǔ)境的延續(xù)表現(xiàn)為選擇合適的漢字組成合理的詩(shī)句,需要解決通順和達(dá)意兩個(gè)難點(diǎn),前者可以通過(guò)RNN模型解決,后者則需要通過(guò)sequence-to-sequence模型來(lái)傳遞前句的意思。
Sequence-to-sequence最早應(yīng)用于機(jī)器翻譯領(lǐng)域,而后應(yīng)用場(chǎng)景拓展到了對(duì)話等語(yǔ)言生成任務(wù)中。Sequence-to-sequence的基本組成是兩個(gè)RNN網(wǎng)絡(luò):LSTM Encoder網(wǎng)絡(luò)和LSTM Decoder網(wǎng)絡(luò)。
Encoder網(wǎng)絡(luò)的目標(biāo)是將第一句詩(shī)的不同元素都表征成一個(gè)實(shí)數(shù)向量,可以理解為將第一句詩(shī)所包含的語(yǔ)義encode到了這些向量中;Decoder網(wǎng)絡(luò)則更像是一個(gè)RNN語(yǔ)言模型,只不過(guò)在選取漢字的時(shí)除考慮已經(jīng)寫(xiě)出來(lái)的前半句還要考慮Encoder網(wǎng)絡(luò)的輸出。Encoder網(wǎng)絡(luò)的輸出時(shí),通過(guò)注意力機(jī)制(Attention)來(lái)選取前句中的中心意思,以便在生成詩(shī)句的時(shí)候做到真正的達(dá)意。
我們認(rèn)為整詩(shī)的質(zhì)量應(yīng)該是能夠通過(guò)人機(jī)協(xié)作共同創(chuàng)作的方式提高的,這和之前的寫(xiě)詩(shī)程序有很大的不同。機(jī)器的模型再豐富,歷史的詩(shī)詞再高雅,其實(shí)都及不上一顆參與其中的真摯的心,所以我們?cè)谠O(shè)計(jì)上鼓勵(lì)用戶參與推敲,提供了自由修改詩(shī)句的能力。
Q:人機(jī)共創(chuàng)的技術(shù)應(yīng)用前景如何?
A:對(duì)于語(yǔ)言的理解和生成可以被應(yīng)用到更廣泛的創(chuàng)作場(chǎng)景里。為機(jī)器裝上“心”,與人協(xié)同創(chuàng)作,將為我們?nèi)斯ぶ悄艿母叻濉拔膶W(xué)藝術(shù)創(chuàng)作”打開(kāi)全新的出路,就像AlphaGo的出現(xiàn),給了職業(yè)棋手學(xué)習(xí)更開(kāi)天辟地的棋路打開(kāi)新的空間一樣。
或許不久將來(lái),天貓精靈能成為一個(gè)超級(jí)輸入法,不用你輸入每一個(gè)想寫(xiě)的字,而是輸入一個(gè)梗概或者主題,天貓精靈就可以生成一篇對(duì)應(yīng)的文章,再交互式的修改一下就完成了。
AI的價(jià)值在于幫助人,不是替代人,人機(jī)共創(chuàng)、共贏或許才是未來(lái)打開(kāi)AI的正確方式。
資料
阿里巴巴人工智能實(shí)驗(yàn)室成立于2016年,負(fù)責(zé)集團(tuán)旗下消費(fèi)級(jí)AI產(chǎn)品的研發(fā)。主要研究方向?yàn)檎Z(yǔ)音、視覺(jué)、行動(dòng)力等。其使命是探索人機(jī)交互新大陸,帶領(lǐng)人們體驗(yàn)探索未知世界的樂(lè)趣。
?
每天一篇技術(shù)文章,
看不過(guò)癮?
關(guān)注“阿里巴巴機(jī)器智能”微信公眾號(hào)
發(fā)現(xiàn)更多AI干貨。
總結(jié)
以上是生活随笔為你收集整理的“天猫精灵”如何为你写诗?人机共创的秘密在这儿的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: AI时代的全链路监控,阿里工程师怎么做?
- 下一篇: 工程师男友如何反窃听?趣聊密码学入门科普