日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

一文看懂多模态大型语言模型GPT-4

發(fā)布時(shí)間:2024/3/13 编程问答 51 豆豆
生活随笔 收集整理的這篇文章主要介紹了 一文看懂多模态大型语言模型GPT-4 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

文章目錄

    • 前言
    • 什么是GPT-4
    • GPT-4 VS GPT-3.5
    • GPT-4與其他模型對(duì)比
    • GPT-4視覺(jué)輸入
    • GPT-4局限性
    • 寫(xiě)在最后

前言

近日,OpenAI發(fā)布了最新版的生成預(yù)訓(xùn)練模型GPT-4。據(jù)官方介紹,最新一代的模型是一個(gè)大模型,性能比CPT-3.5強(qiáng)悍很多,不僅僅是接受圖像、文本、代碼等的輸入輸出,更多的是在很多專業(yè)領(lǐng)域表現(xiàn)出人類的水準(zhǔn)水;與上一代不同的是它的核心技術(shù)是基于Transformer的自回歸語(yǔ)言模型,使用了大量的無(wú)標(biāo)注數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,學(xué)習(xí)了自然語(yǔ)言和其他模態(tài)之間的通用表示和關(guān)系。那么,今天我們就要一探究竟。

什么是GPT-4

GPT-4是OpenAI公司3月推出的新一代人工智能預(yù)訓(xùn)練AI模型,是一個(gè)多模態(tài)大型語(yǔ)言模型,使用了1.5萬(wàn)億個(gè)參數(shù),是GPT-3.5的10倍之多,當(dāng)然它也是世界上最大的人工智能模型。

據(jù)官方所述GPT-4是OpenAI在擴(kuò)大深度學(xué)習(xí)方面的最新里程碑,是一個(gè)大型多模態(tài)模型(接受圖像和文本輸入,發(fā)出文本輸出),雖然在許多現(xiàn)實(shí)世界場(chǎng)景中的能力不如人類,但在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類水平的性能。例如,它通過(guò)了模擬律師考試,分?jǐn)?shù)在前10%左右;相比之下,GPT-3.5的得分在10%左右。我們花了6個(gè)月的時(shí)間,利用我們對(duì)抗性測(cè)試計(jì)劃和ChatGPT的經(jīng)驗(yàn)教訓(xùn),反復(fù)調(diào)整GPT-4,在真實(shí)性、可操縱性和拒絕走出護(hù)欄方面取得了有史以來(lái)最好的結(jié)果。足以證明GPT-4簡(jiǎn)直就是人工智能預(yù)訓(xùn)練模型中的勞斯奈斯,簡(jiǎn)直牛得不要不要的。

GPT-4 VS GPT-3.5

官方文檔說(shuō)GPT-3.5和GPT-4之間的區(qū)別可能很小,但是當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),差異就會(huì)顯現(xiàn)出來(lái)——GPT-4比GPT-3.5更可靠、更具創(chuàng)造力,并且能夠處理更細(xì)微的指令。

官方為了比較這兩個(gè)模型之間的差異,在各種基準(zhǔn)上進(jìn)行了測(cè)試,包括最初為人類設(shè)計(jì)的模擬考試,以及最新的公開(kāi)考試(在奧運(yùn)會(huì)和AP免費(fèi)回答問(wèn)題的情況下),或者購(gòu)買了2022年至2023年的練習(xí)考試。在測(cè)試過(guò)程中并沒(méi)有對(duì)這些考試進(jìn)行專門的培訓(xùn),如下圖所示,在這些偏向人類獨(dú)立思考的考試中,GPT-4比GPT-3.5更加的可靠和更歐創(chuàng)造力。

GPT-4與其他模型對(duì)比

OpenAI為機(jī)器學(xué)習(xí)模型設(shè)計(jì)的傳統(tǒng)基準(zhǔn)上評(píng)估了GPT-4,GPT-4大大優(yōu)于現(xiàn)有的大型語(yǔ)言模型,以及大多數(shù)最先進(jìn)的(SOTA)模型,這些模型可能包括特定于基準(zhǔn)的手工制作或額外的訓(xùn)練協(xié)議。

在測(cè)試的26種語(yǔ)言中的24種中,GPT-4的英語(yǔ)性能優(yōu)于GPT-3.5和其他LLM(Chinchilla、PaLM),包括拉脫維亞語(yǔ)、威爾士語(yǔ)和斯瓦希里語(yǔ)等低資源語(yǔ)言。

GPT-4視覺(jué)輸入

GPT-4可以接受文本和圖像的提示,這與純文本設(shè)置平行,允許用戶指定任何視覺(jué)或語(yǔ)言任務(wù)。具體來(lái)說(shuō),它生成由穿插的文本和圖像組成的給定輸入的文本輸出(自然語(yǔ)言、代碼等)。在一系列領(lǐng)域,包括帶有文本和照片的文檔、圖表或屏幕截圖,GPT-4表現(xiàn)出與純文本輸入類似的功能。此外,它可以通過(guò)為純文本語(yǔ)言模型開(kāi)發(fā)的測(cè)試時(shí)技術(shù)進(jìn)行擴(kuò)展,包括少量鏡頭和思維鏈提示。圖像輸入仍然是一個(gè)研究預(yù)覽,暫時(shí)并未對(duì)公眾公開(kāi)。

GPT-4局限性

盡管GPT-4具有功能,但它與早期的GPT模型具有類似的局限性。最重要的是,它仍然不是完全可靠的(它會(huì)“幻覺(jué)”事實(shí)并犯推理錯(cuò)誤)。在使用語(yǔ)言模型輸出時(shí),特別是在高風(fēng)險(xiǎn)的上下文中,應(yīng)該非常小心,因?yàn)榇_切的協(xié)議(如人工審查、以額外的上下文為基礎(chǔ)或完全避免高風(fēng)險(xiǎn)的使用)與特定用例的需求相匹配。

雖然GPT-4仍然存在問(wèn)題,但與之前的模型相比,它顯著減少了幻覺(jué)。在官方的內(nèi)部對(duì)抗性事實(shí)評(píng)估中,GPT-4的得分比最新的GPT-3.5高40%:

寫(xiě)在最后

GPT-4應(yīng)該算得上是至今為止最為強(qiáng)大的人工智能預(yù)訓(xùn)練模型,無(wú)論是性能上、可靠性以及創(chuàng)造力都較GPT-3.5有較大提升。特別是最新的視覺(jué)輸入功能,模型可以根據(jù)圖片視覺(jué)分析并給出自己獨(dú)立的答案,這可以算得上人工智能方向的一個(gè)新里程碑。雖然很強(qiáng)悍,但GPT-4還是有早期模型類似的局限性。所以,GPT-4之后的路還很長(zhǎng)呀!

路漫漫其修遠(yuǎn)兮,吾將上下而求索
有興趣的小伙伴也可以加我:
訂閱號(hào) ‘架構(gòu)集結(jié)號(hào)’
知識(shí)星球 ‘Coding社區(qū)’

總結(jié)

以上是生活随笔為你收集整理的一文看懂多模态大型语言模型GPT-4的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。