阿里给所有卖家发福利:全球首个人工智能中文字库免费用
摘要:?你打開(kāi)手機(jī)淘寶,精美的海報(bào)讓你目不轉(zhuǎn)睛,你下了單,從快遞員手中接過(guò)商品,心滿意足的那一刻,你不會(huì)想到自己在掏錢(qián)買(mǎi)下商品的同時(shí)也為海報(bào)買(mǎi)了單,從模特、攝影到設(shè)計(jì)師的后期處理,越精美的海報(bào)成本越高,當(dāng)然,你更想不到的是,海報(bào)上的每一個(gè)字都是要花錢(qián)的…… 最近,阿里巴巴悄悄推出了全球首個(gè)人工智能中文字庫(kù),這款阿里漢儀智能黑體測(cè)試版,目前擁有3500個(gè)中文漢字,將免費(fèi)提供給阿里用戶使用。
點(diǎn)此查看原文:http://click.aliyun.com/m/42630/
你打開(kāi)手機(jī)淘寶,精美的海報(bào)讓你目不轉(zhuǎn)睛,你下了單,從快遞員手中接過(guò)商品,心滿意足的那一刻,你不會(huì)想到自己在掏錢(qián)買(mǎi)下商品的同時(shí)也為海報(bào)買(mǎi)了單,從模特、攝影到設(shè)計(jì)師的后期處理,越精美的海報(bào)成本越高,當(dāng)然,你更想不到的是,海報(bào)上的每一個(gè)字都是要花錢(qián)的……
最近,阿里巴巴悄悄推出了全球首個(gè)人工智能中文字庫(kù),這款阿里漢儀智能黑體測(cè)試版,目前擁有3500個(gè)中文漢字,將免費(fèi)提供給阿里用戶使用。
服務(wù)市場(chǎng)下載頁(yè)面
這既是阿里給電商賣(mài)家的春節(jié)福利,也是一種新的嘗試,阿里希望用技術(shù)手段,降低造字成本,讓字體市場(chǎng)進(jìn)入良性發(fā)展。而這項(xiàng)技術(shù)的受惠者,除了商家、字體公司,當(dāng)然還包括了消費(fèi)者。
一套版權(quán)費(fèi)20萬(wàn)的字體一套正版字體價(jià)值不菲。
據(jù)悉,天貓上某商家就為一套方正蘭亭字體支付了20萬(wàn)元左右的版權(quán)費(fèi),雖然14款不同字體可以使用5年,但對(duì)商家來(lái)講,“要價(jià)還是偏高”。
萬(wàn)一有適合廣告宣傳的收費(fèi)字體,但前期沒(méi)有購(gòu)買(mǎi)版權(quán)怎么辦?
讓設(shè)計(jì)師對(duì)已有的字體進(jìn)行修改加工,變成新的字體,是一種解決辦法。然而一位設(shè)計(jì)師曾花了半天時(shí)間,只設(shè)計(jì)出6個(gè)中文漢字。
“修改設(shè)計(jì)每個(gè)單字不難,把控字體的統(tǒng)一性才是最難的。”該設(shè)計(jì)師表示,例如“品”“門(mén)”“口”這樣的字結(jié)構(gòu)過(guò)于單一,在修改時(shí)反而會(huì)增加難度。“有時(shí)會(huì)發(fā)現(xiàn),組合成的一句話中出現(xiàn)了兩種字體,甚至6個(gè)字的標(biāo)題中會(huì)出現(xiàn)6種字體,很頭疼。”
出于成本考慮,一些商家并不愿意在購(gòu)買(mǎi)字體版權(quán)上花錢(qián),只使用阿里平臺(tái)上免費(fèi)商用的華康字體和開(kāi)源字體。
還有部分商家,則選擇使用未經(jīng)授權(quán)的字體,踩中了涉嫌“字體侵權(quán)”的雷區(qū)。一旦被字體公司起訴,商家除了賠錢(qián),還要撤回已經(jīng)發(fā)布的字體內(nèi)容,企業(yè)的品牌形象和銷(xiāo)售業(yè)績(jī)都會(huì)受到影響。
為什么造字成本這么高一套字體為何要價(jià)萬(wàn)元,字體公司為何四處維權(quán)打官司?侵權(quán)與維權(quán)的背后,不僅僅是利益的撕扯,還有關(guān)于創(chuàng)意價(jià)值的認(rèn)可度。
用傳統(tǒng)的方法創(chuàng)造一套字體,其實(shí)成本很高,因?yàn)樾枰?jīng)過(guò)創(chuàng)意、選字、確定、拼字、自動(dòng)分裝等一系列漫長(zhǎng)的流程。
一套字體通常有兩個(gè)特點(diǎn):字型和字量。字型是設(shè)計(jì)師對(duì)字體的“創(chuàng)意”,字庫(kù)字體講究整體的搭配協(xié)調(diào)和美感。
而每套字體的字量通常由市場(chǎng)需求決定。常用的中文簡(jiǎn)體有6763個(gè)中文漢字,包含中文簡(jiǎn)繁的9169個(gè),用于出版物的大字符集(包含很多生僻字)27533個(gè),包含稀有地名人名用字的超大字符集包含中文7萬(wàn)字以上。
傳統(tǒng)字體公司的設(shè)計(jì)師,可以設(shè)計(jì)出很獨(dú)特的單個(gè)中文字體,但即便是難度相對(duì)低的字型,他們也很難獨(dú)立完成整套設(shè)計(jì)。通常是,主創(chuàng)意者創(chuàng)作五六百個(gè)字,確定字體的基調(diào)后,再由團(tuán)隊(duì)其他成員完成剩下的工作。
每一個(gè)字都要經(jīng)過(guò)設(shè)計(jì)師一筆一畫(huà)地仔細(xì)勾勒、調(diào)整。通常,設(shè)計(jì)一套風(fēng)格字庫(kù)需要設(shè)計(jì)1萬(wàn)個(gè)左右的字符和標(biāo)點(diǎn)符號(hào),少則半年、多則好幾年才能進(jìn)入市場(chǎng)。而且,設(shè)計(jì)出的字體還可能因?yàn)椴皇苡脩魵g迎而宣告失敗。
設(shè)計(jì)成本居高不下,導(dǎo)致正版字體價(jià)值不菲,而正版支持者越少,造字成本越高,價(jià)格更加降不下來(lái),造字市場(chǎng)就會(huì)陷入惡性循環(huán)。
怎么用人工智能造字
阿里巴巴每年也要向字體公司支付金額可觀的版權(quán)費(fèi)用,就像阿里人機(jī)自然交互實(shí)驗(yàn)室經(jīng)常與字體打交道,因?yàn)樗麄兊囊粋€(gè)研究方向就是設(shè)計(jì)智能。
“字體相當(dāng)于設(shè)計(jì)領(lǐng)域的水電煤。”實(shí)驗(yàn)室負(fù)責(zé)人楊昌源說(shuō),“有的字體真的很好看,我們真的很想用,但是太貴了。”
正版字體這么貴,有沒(méi)有可能讓造字成本變低?楊昌源決定帶領(lǐng)團(tuán)隊(duì)在字體領(lǐng)域做一個(gè)新的嘗試,用AI生成字體。
“阿里有人才有技術(shù)有資源來(lái)做這件事情。”楊昌源覺(jué)得,造出一款免費(fèi)字體,對(duì)阿里來(lái)講很有價(jià)值,既能讓商家不再擔(dān)心版權(quán)問(wèn)題,也能讓字體市場(chǎng)變得更加健康。
彼時(shí),實(shí)驗(yàn)室正好與阿里PAI團(tuán)隊(duì)在其他業(yè)務(wù)上有所交集,后者主要負(fù)責(zé)基于阿里云分布式計(jì)算引擎的一款機(jī)器學(xué)習(xí)算法平臺(tái),“能不能提供技術(shù)支持我們做些事?”楊昌源向?qū)Ψ桨l(fā)出了合作邀請(qǐng)。
實(shí)驗(yàn)室想要引入新的技術(shù)改變現(xiàn)狀,PAI團(tuán)隊(duì)想要試驗(yàn)新的技術(shù),雙方一拍即合,很快達(dá)成跨團(tuán)隊(duì)合作的意向,他們打算讓機(jī)器做出一套“跟人做的一模一樣的”精美的字體。
此次AI造字,PAI團(tuán)隊(duì)的人工智能專(zhuān)家張慶、孫東慧針對(duì)字體生成的特定場(chǎng)景將對(duì)抗生成網(wǎng)絡(luò)(GAN)進(jìn)行了改進(jìn)。
團(tuán)隊(duì)先用天貓字體和淘字體做嘗試,但由于兩類(lèi)字體的樣本量太少,在手動(dòng)補(bǔ)充字體樣本,用了一兩百組算法模型后,設(shè)計(jì)團(tuán)隊(duì)仍認(rèn)為,字體的精準(zhǔn)度不夠,還是半成品。
“因?yàn)樽鼍珳?zhǔn)設(shè)計(jì)的設(shè)計(jì)師擁有像素級(jí)的眼睛,左偏了一個(gè)像素都不舒服。” 楊昌源解釋道。
兩個(gè)團(tuán)隊(duì)在標(biāo)準(zhǔn)上不能達(dá)成一致,AI造字陷入瓶頸。
造一套自帶流量的字調(diào)整方向還是就此放棄?楊昌源決定,引入專(zhuān)業(yè)的字體公司一起來(lái)制定標(biāo)準(zhǔn)。
找字體公司合作并非一帆風(fēng)順。“起初談的時(shí)候蠻難的,字體公司的危機(jī)感比我們強(qiáng)很多。”楊昌源表示。
很多人懼怕人工智能技術(shù)。最初,字體公司擔(dān)心,自己的生意甚至是整個(gè)字體行業(yè)會(huì)“沒(méi)了”,更擔(dān)心阿里這個(gè)巨頭會(huì)不會(huì)進(jìn)入字體這個(gè)商業(yè)航道。
“字體并不在阿里的主航道上,我們沒(méi)有野心深度介入字體行業(yè)。”楊昌源反復(fù)向?qū)Ψ浇忉?#xff0c;用人工智能造字,是想要嘗試將新技術(shù)運(yùn)用到傳統(tǒng)的字體領(lǐng)域,“我們不會(huì)跟傳統(tǒng)行業(yè)直接去競(jìng)爭(zhēng),我們更多是給大家一個(gè)示范,畢竟專(zhuān)業(yè)領(lǐng)域的事情還是要靠專(zhuān)業(yè)的人去做。”
在合同上來(lái)來(lái)回回討論了個(gè)把月后,去年12月,漢儀終于與阿里簽訂了合同,決定雙方聯(lián)手做一套有AI技術(shù)成分的字體。雙方?jīng)Q定合作的字體是漢儀公司的明星產(chǎn)品,AI造的字體相當(dāng)于是給這個(gè)系列產(chǎn)品做了延伸。
楊昌源說(shuō),“簽下合同后,我們定下目標(biāo):農(nóng)歷年前,一定要出一個(gè)版本給大家看,看能到什么程度。
這次合作中,漢儀字庫(kù)的設(shè)計(jì)師負(fù)責(zé)字體的造型設(shè)計(jì),阿里的技術(shù)團(tuán)隊(duì)負(fù)責(zé)技術(shù),最終通過(guò)“喂養(yǎng)”機(jī)器,讓其自學(xué)并生成了一套字庫(kù)。
阿里漢儀智能黑體字形設(shè)計(jì)
在大數(shù)據(jù)的幫助下,漢儀字庫(kù)設(shè)計(jì)部負(fù)責(zé)人鄭乃玉了解到,一套字體設(shè)計(jì)出約3500字就能覆蓋常用的電商廣告用語(yǔ)。
讓字體設(shè)計(jì)師們糾結(jié)的是,什么樣的字體能幫助電商提升銷(xiāo)量。他們希望造出一套“自帶流量”的字體,鄭乃玉說(shuō),“例如,商品廣告中‘降價(jià)了’這樣突出的語(yǔ)言最適合使用現(xiàn)在的字體。”
“不能以人為標(biāo)準(zhǔn)去評(píng)判AI字體的好壞。”楊昌源表示,評(píng)價(jià)字體好壞的標(biāo)準(zhǔn)是,生成的字體跟樣本字體有90%以上的神似即可,“至少看上去,它像一套字體。”
2018年1月22日,阿里巴巴終于推出了全球首個(gè)人工智能中文字庫(kù)——阿里漢儀智能黑體,并免費(fèi)提供給阿里用戶使用。
正式版將于4月推出在這套智能字庫(kù)測(cè)試版本發(fā)布當(dāng)天,景德鎮(zhèn)胡圖網(wǎng)絡(luò)科技公司的設(shè)計(jì)師們?cè)诘谝粫r(shí)間就下載使用了,設(shè)計(jì)部的胡經(jīng)理解釋,他們的設(shè)計(jì)師主要做電商設(shè)計(jì)的排版,自己根本沒(méi)有時(shí)間設(shè)計(jì)字體,“現(xiàn)在又有新的選擇,還是AI生成的,當(dāng)然要馬上試用一下。”
試用后,胡經(jīng)理也發(fā)現(xiàn)了測(cè)試版的一些問(wèn)題,例如螺螄粉中的“螄”、聚會(huì)中的“聚”字在被放大后會(huì)顯得棱角不明,像是沒(méi)有切割完整。另外,阿里這套字體只適用于醒目的大標(biāo)題,8號(hào)、12號(hào)大小的字體就不夠清晰且略顯粗糙。
胡經(jīng)理發(fā)現(xiàn)測(cè)試版中字體的一些問(wèn)題
漢儀字庫(kù)設(shè)計(jì)部負(fù)責(zé)人鄭乃玉表示,AI只能生成字體,并不會(huì)自己做調(diào)整,人機(jī)協(xié)作是目前的最佳手段,“橫平豎直、棱角分明的漢字還是要靠人工干預(yù)。”
楊昌源也坦言,測(cè)試版本不完美,還在繼續(xù)優(yōu)化。2018年4月,“阿里漢儀智能黑體”將推出正式版本,最終字符集可能是6763,未來(lái)將用于服務(wù)阿里新零售下千萬(wàn)商家及阿里設(shè)計(jì)生態(tài)。
字體機(jī)器生成過(guò)程
人工智能改變字體行業(yè)電商賣(mài)家成千上萬(wàn),消費(fèi)者喜歡的風(fēng)格也五花八門(mén),胡經(jīng)理就發(fā)現(xiàn),女性用戶更喜歡秀氣的字體,但這套人工智能字庫(kù)的字體略顯粗獷。
對(duì)此,楊昌源表示,“阿里在字體領(lǐng)域做嘗試是想告訴大家,字體領(lǐng)域是可以有這樣一個(gè)成果的,進(jìn)而鼓勵(lì)大家在有奔頭的情況下去做一些嘗試。”
“我們想解決的是,當(dāng)創(chuàng)意很好的時(shí)候,怎么加速創(chuàng)意產(chǎn)生到生成的過(guò)程。以前設(shè)計(jì)一套字體需要投入10個(gè)人做一年,現(xiàn)在引進(jìn)新技術(shù),能夠節(jié)省4-8個(gè)月的時(shí)間,可以讓字體設(shè)計(jì)人員把注意力更多的放在創(chuàng)意上。” 楊昌源表示。
按照楊昌源的想象,未來(lái),字體行業(yè)可能是另一個(gè)景象。“字體生態(tài)豐富起來(lái),字體的版權(quán)也許就不會(huì)那么貴了。”
AI造字的過(guò)程中,也產(chǎn)生了副產(chǎn)品。“字體檢測(cè),我們能夠做的很精準(zhǔn)了。” 楊昌源透露,現(xiàn)在他們可以檢測(cè)某字體可能盜用了哪幾款正版字體,并提供相應(yīng)的概率。
在造“阿里漢儀智能黑體”的同時(shí),團(tuán)隊(duì)從市面上收集來(lái)雍正的毛筆字,臨摹出來(lái)后給機(jī)器學(xué)習(xí),機(jī)器通過(guò)自學(xué)仿造出了雍正字體。這項(xiàng)技術(shù)無(wú)疑將給字體行業(yè)、文物及博物館修復(fù)帶來(lái)一些新的嘗試和可能性。
楊昌源開(kāi)玩笑說(shuō),“以后過(guò)年,可以讓‘雍正賜字’,給電商賣(mài)家做些好彩頭。”
掃描二維碼,獲取更多資訊:
總結(jié)
以上是生活随笔為你收集整理的阿里给所有卖家发福利:全球首个人工智能中文字库免费用的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 通用智能传感集线器(Sensorhub)
- 下一篇: MaxCompute印尼开服,成为阿里云