“通义千问”首发体验:响应速度出色 多轮对话有优势
繼3月份百度公布文心一言之后,國(guó)內(nèi)的另外一家人工智能公司——阿里云,在4月7日宣布自研大模型“通義千問(wèn)”開(kāi)始邀請(qǐng)用戶(hù)測(cè)試體驗(yàn)。據(jù)悉,該模型目前主要是定向邀請(qǐng)企業(yè)級(jí)用戶(hù)進(jìn)行體驗(yàn)測(cè)試,可通過(guò)官網(wǎng)申請(qǐng),符合條件的用戶(hù)可參與體驗(yàn)。
通義千問(wèn)
據(jù)CNMO了解,阿里的達(dá)摩院早已在該領(lǐng)域布局多年,并在2019年啟動(dòng)了大模型研發(fā),于2022年9月發(fā)布了“通義”大模型系列。
關(guān)于“通義千問(wèn)”這個(gè)名稱(chēng),從字面上就能夠看出其自身的定位——通曉各類(lèi)知識(shí),回答千種問(wèn)題。當(dāng)然,這個(gè)只是筆者的個(gè)人理解,因此筆者直接將此問(wèn)題詢(xún)問(wèn)了“通義千問(wèn)”,其回答表示“通義”意味著該模型具有廣泛的知識(shí)和普適性,可以理解和回答各種領(lǐng)域的問(wèn)題。“千問(wèn)”代表了模型可以回答各種問(wèn)題,包括常見(jiàn)的、復(fù)雜的甚至是少見(jiàn)的問(wèn)題。就如同其所具備的功能一樣,回答問(wèn)題、創(chuàng)作文字,表達(dá)觀(guān)點(diǎn)以及撰寫(xiě)代碼等。
通義千問(wèn)首頁(yè)布局
在該模型的體驗(yàn)界面上,羅列著一些建議指令,比如“寫(xiě)一段電影腳本,講一個(gè)北漂草根創(chuàng)業(yè)逆襲的故事”、“作為手機(jī)斗地主游戲的產(chǎn)品經(jīng)理,該如何做成國(guó)內(nèi)爆款”、“團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)對(duì)話(huà)機(jī)器人,給老板寫(xiě)郵件介紹”等等。而與百度的文心一言不同的是,最下方則是有一個(gè)可以體驗(yàn)更多小應(yīng)用的百寶袋。
百寶袋頁(yè)面
點(diǎn)進(jìn)這個(gè)百寶袋后,我們可以看到該頁(yè)面主要將其內(nèi)置的小應(yīng)用分為了三個(gè)大類(lèi),分別是效率類(lèi),生活類(lèi)以及娛樂(lè)類(lèi)。效率類(lèi)中提供了“寫(xiě)提綱”、“SWOT分析”和“商品描述生成”這三個(gè)功能,因此很明顯此類(lèi)功能是用以解決辦公需求的,尤其是其中的商品描述生成,就與阿里旗下TOB、TOC的電商業(yè)務(wù)相匹配。
百寶袋頁(yè)面
另外的生活類(lèi)和娛樂(lè)類(lèi)則是分別包括“會(huì)放飛的菜譜”、“小學(xué)生作文”、以及“然后呢”和“彩虹屁專(zhuān)家”、“寫(xiě)情書(shū)”和“為你寫(xiě)詩(shī)”。其中最讓筆者感興趣的是“然后呢”這個(gè)功能,個(gè)人認(rèn)為該功能適合放在娛樂(lè)類(lèi)里,而不是生活類(lèi)。其介紹是為“寫(xiě)一個(gè)句子作為開(kāi)頭,然后看發(fā)生了什么”。筆者嘗試輸入了“在一個(gè)月亮變成紅色的夜晚”,結(jié)果是生成了一篇短小的兒童故事,相信這項(xiàng)功能十分適合孩子處于學(xué)齡前時(shí)期的父母?jìng)儯槐卦贀?dān)心沒(méi)有足夠的故事去哄孩子們睡覺(jué)。
“然后呢”小應(yīng)用生成結(jié)果
為了分辨在功能區(qū)內(nèi)輸入與在常規(guī)問(wèn)答中輸入的區(qū)別,我又將剛才的“紅月”輸入到了常規(guī)界面,最終通義千問(wèn)給出了十分科學(xué)的回答,解釋了月亮變紅的原因。由此可見(jiàn),百寶袋中的各項(xiàng)小應(yīng)用應(yīng)該是加了更多的限制指令,從而實(shí)現(xiàn)了不同種類(lèi)的功能呈現(xiàn)。
常規(guī)界面生成的結(jié)果
在實(shí)際體驗(yàn)后,筆者發(fā)現(xiàn)通義千問(wèn)在語(yǔ)言的理解能力上表現(xiàn)得可圈可點(diǎn),基本沒(méi)有出現(xiàn)一些所問(wèn)非所答的情況,并且在生成結(jié)果時(shí)的響應(yīng)速度方面也表現(xiàn)得較為出色,但在內(nèi)容的呈現(xiàn)較為粗略。
通義千問(wèn)生成結(jié)果
筆者嘗試與百度的文心一言做了對(duì)比,同時(shí)輸入了“請(qǐng)以科幻小說(shuō)的方式為神雕俠侶敘寫(xiě)結(jié)尾”的指令。雖然在響應(yīng)速度以及結(jié)果輸出的過(guò)程中,通義千問(wèn)表現(xiàn)得十分快速且順暢,但在最終的內(nèi)容質(zhì)量上,個(gè)人覺(jué)得文心一言的內(nèi)容更好。因?yàn)橥x千問(wèn)所生成的內(nèi)容更偏向一個(gè)內(nèi)容梗概,而文心一言所處生成的內(nèi)容細(xì)節(jié)則更加豐富。
文心一言生成結(jié)果
其他方面,筆者在嘗試讓其生成一份詳細(xì)的旅游攻略時(shí),所呈現(xiàn)出的結(jié)果曾出現(xiàn)排版錯(cuò)誤的情況,但再后續(xù)的多次嘗試中又恢復(fù)了正常。造成這個(gè)問(wèn)題的原因可能是多方面的,比如開(kāi)啟內(nèi)測(cè)后突然涌入了太多用戶(hù),又或者是其已經(jīng)自動(dòng)修復(fù)了此項(xiàng)問(wèn)題。此外,通義千問(wèn)對(duì)待一些較新、或者較為專(zhuān)業(yè)的信息的抓取與理解上略有不足。筆者曾讓其生成一份魅族20手機(jī)(2023.3.30發(fā)布)的宣傳視頻腳本。暫且不論其腳本的完成度與可行性,其中關(guān)于手機(jī)的參數(shù)方面就出現(xiàn)了錯(cuò)誤,如圖中紅框圈出的內(nèi)容都是錯(cuò)誤的呈現(xiàn)。
通義千問(wèn)出現(xiàn)的錯(cuò)誤信息
這種情況其實(shí)是可以理解,因?yàn)樵诠P者詢(xún)問(wèn)了通義千問(wèn)是否是基于中文來(lái)理解的,其表示否認(rèn),并表示是“基于自然語(yǔ)言處理的技術(shù)實(shí)現(xiàn)的,可以理解中文,但我的主要語(yǔ)言是英文”。筆者還注意到,相較于國(guó)外的ChatGPT和國(guó)內(nèi)的文心一言,阿里云的這款通義千問(wèn)目前僅提供了文本交互的單一模態(tài),并未支持語(yǔ)音、圖片等其他方式的多模態(tài)功能。
通義千問(wèn)對(duì)于理解語(yǔ)言的回答
總的來(lái)說(shuō),阿里云作為國(guó)內(nèi)深耕AI領(lǐng)域的科技大廠(chǎng),其推出的“通義千問(wèn)”目前是國(guó)內(nèi)第二個(gè)、世界第三個(gè)正式推出的AI大模型。可以說(shuō)是已經(jīng)走在了AI這條通向未來(lái)之路的前列。
其實(shí)國(guó)內(nèi)很多的企業(yè)都像阿里這樣,很早就投入了關(guān)于A(yíng)I大模型的研發(fā)之中,但估計(jì)是沒(méi)有想到國(guó)外的ChatGPT能夠在一個(gè)可用度很高的基礎(chǔ)上迅速上線(xiàn)。而在國(guó)內(nèi)廠(chǎng)商之中,能夠快速跟上并且正式推出相關(guān)產(chǎn)品的企業(yè)一定也是準(zhǔn)備得較為倉(cāng)促。因此通義千問(wèn)雖然還存在著一定的問(wèn)題,卻是可以理解的,并且通義千問(wèn)作為一個(gè)改進(jìn)工作與生活的AI工具、AI助手,其功能的完善與升級(jí)就是需要在用戶(hù)的使用過(guò)程中不斷地學(xué)習(xí)與進(jìn)化。
目前,大語(yǔ)言模型已經(jīng)成為了互聯(lián)網(wǎng)和科技相關(guān)企業(yè)加速布局的熱門(mén)賽道。在這場(chǎng)“馬拉松賽跑”中,起步越早,所能獲取的“進(jìn)化”資源就會(huì)越多。同時(shí)多款產(chǎn)品的落地,也會(huì)促進(jìn)該類(lèi)產(chǎn)業(yè)的升級(jí)與發(fā)展。相信在未來(lái),其他互聯(lián)網(wǎng)巨頭也會(huì)紛紛開(kāi)啟類(lèi)似產(chǎn)品的內(nèi)測(cè)。所以,這場(chǎng)有關(guān)AI大模型“戰(zhàn)爭(zhēng)”的“硝煙”才剛剛升起。
總結(jié)
以上是生活随笔為你收集整理的“通义千问”首发体验:响应速度出色 多轮对话有优势的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 单卡 30 秒预测未来 10 天全球天气
- 下一篇: SAP CRM呼叫中心end按钮的实现逻