日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

大模型靠“深呼吸”数学再涨 8 分!谷歌 DeepMind 发现 AI 自己设计提示词效果胜人类

發布時間:2024/6/21 综合教程 38 生活家
生活随笔 收集整理的這篇文章主要介紹了 大模型靠“深呼吸”数学再涨 8 分!谷歌 DeepMind 发现 AI 自己设计提示词效果胜人类 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

提示詞中加上“深呼吸”,AI 大模型數學成績就能再漲 8.4 分!

谷歌 DeepMind 團隊最新發現,用這個新“咒語”(Take a deep breath)結合大家已經熟悉的“一步一步地想”(Let’s think step by step),大模型在 GSM8K 數據集上的成績就從 71.8 提高到 80.2 分。

而且這個最有效的提示詞,是 AI 自己找出來的。

有網友開玩笑說,深呼吸以后,散熱風扇就轉速就提高了。

也有人表示,剛高薪入職的提示工程師們也應該深呼吸,工作可能干不久了

相關論文《大語言模型是優化器》,再次引起轟動。

具體來說,大模型自己設計的提示詞在 Big-Bench Hard 數據集上最高提升 50%。

也有人的關注點在“不同模型的最佳提示詞不一樣”。

并且不止提示詞設計這一個任務,在論文中還測試了大模型在線性回歸和旅行商問題這些經典優化任務上的能力。

模型不同,最佳提示詞也不同

優化問題無處不在,基于導數和梯度的算法是強大的工具,但現實應用中也經常遇到梯度不適用的情況。

為解決這個問題,團隊開發了新方法 OPRO,也就是通過提示詞優化(Optimization byPROmpting)。

不是形式化定義優化問題然后用程序求解,而是用自然語言描述優化問題,并要求大模型生成新的解決方案。

一圖流總結,就是對大模型的一種遞歸調用。

每一步優化中,以之前生成的解決方案和評分作為輸入,大模型生成新的方案并評分,再將其添加到提示詞中,供下一步優化使用。

論文主要使用谷歌的 PaLM 2 和 Bard 中的 text-bison 版本作為評測模型。

再加上 GPT-3.5 和 GPT-4,共 4 種模型作為優化器。

結果表明,不光不同模型設計出的提示詞風格不同,適用的提示詞風格也不同。

此前在 GPT 系列上的 AI 設計出的最優提示詞是“Let’s work this out in a step by step way to be sure we have the right answer.”

這個提示詞使用 APE 方法設計,論文發表在 ICLR 2023 上,在 GPT-3(text-davinci-002)上超過人類設計的版本“Let’s think step by step”。

但這次在谷歌系 PaLM 2 和 Bard 上,APE 版本作為基線就還不如人類版本。

OPRO 方法設計出來的新提示詞中,“深呼吸”和“拆解這個問題”對 PaLM 來說效果最好。

對 text-bison 版的 Bard 大模型來說,則更傾向于詳細的提示詞。

另外論文還展示了大模型在數學優化器上的潛力。

線性回歸作為連續優化問題的示例。

旅行商問題作為離散優化問題的示例。

僅僅通過提示,大模型就能找到不錯的解決方案,有時甚至匹敵或超過手動設計的啟發式算法。

但團隊也認為大模型還無法替代傳統基于梯度的優化算法,當問題規模較大(如節點數量較多的旅行商問題)時,OPRO 方法表現就不好。

對于未來改進方向,團隊提出當前大模型還無法有效利錯誤案例,僅提供錯誤案例無法讓大模型捕捉捕捉到錯誤的原因。

一個有前景的方向是結合關于錯誤案例的更豐富的反饋,并總結優化軌跡中高質量和低質量生成提示的關鍵特征差異。

這些信息可能幫助優化器模型更高效地改進過去生成的提示,并可能進一步減少提示優化所需的樣本數量。

論文放出大量最優提示詞

論文來自谷歌與 DeepMind 合并后的部門,但作者以原谷歌大腦團隊為主,包括 Quoc Le、周登勇。

共同一作為康奈爾大學博士畢業的復旦校友 Chengrun Yang,和 UC 伯克利博士畢業的上交大校友陳昕昀。

團隊還在論文中給出了大量實驗中得到的最優提示詞,包括電影推薦、惡搞電影名字等實用場景,有需要的小伙伴可自取。

論文地址:

https://arxiv.org/abs/2309.03409

參考鏈接:

[1]https://x.com/emollick/status/1700207590607552740

廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,所有文章均包含本聲明。

總結

以上是生活随笔為你收集整理的大模型靠“深呼吸”数学再涨 8 分!谷歌 DeepMind 发现 AI 自己设计提示词效果胜人类的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 欧美经典一区二区 | 我们好看的2018视频在线观看 | 性色av一区二区三区红粉影视 | 国产免费看 | 日韩在线无 | 久久大胆人体 | 777奇米色 | 色播在线 | 久久理论片 | 国产又粗又黄又爽的视频 | 一级黄色a视频 | 免费色视频 | 乱色专区| 日韩一级黄色录像 | 白浆av | 影音先锋国产资源 | 人妻互换 综合 | 污视频导航 | 99欧美精品 | 国产视频手机在线观看 | 精品国产一二 | 香蕉视频色版 | 国产精品一区二区性色av | 日本九九视频 | 日韩av在线免费看 | 天天av天天操 | 日日摸日日添日日碰9学生露脸 | 三级黄色生活片 | 国产美女啪啪 | 噜噜噜久久,亚洲精品国产品 | 91精品国产高清一区二区三蜜臀 | 亚洲国内在线 | 五月激情网站 | 国产做爰全过程免费视频 | 国产污视频在线看 | 九九久久久| 在线黄色免费 | 亚洲a网站 | 国内国产精品天干天干 | 中文字幕一区二区在线播放 | 日日狠狠| 午夜色av | 色综合天天网 | 亚洲精品久久久久久久久久吃药 | 99精品国自产在线 | 日本xx视频免费观看 | 亚洲有吗在线 | 中文字幕成人在线观看 | 丰满多毛的大隂户视频 | 国产网站久久 | 欧美一级做a爰片久久高潮 久热国产精品视频 | 欧美色资源 | 91精品人妻一区二区三区 | 正在播放久久 | 波多野结衣网址 | 粉嫩av懂色av蜜臀av分享 | 亚洲成av人片在www色猫咪 | 久久久久久久久99精品 | 中文字幕3区| 无码 人妻 在线 视频 | 69综合| 青青操网 | 日本大尺度吃奶做爰久久久绯色 | 亚洲黄视频 | 蜜桃视频在线观看一区 | 色欲狠狠躁天天躁无码中文字幕 | 久久大尺度 | 日本视频www色 | 国产真实乱人偷精品视频 | 免费大片黄在线观看视频网站 | 国产极品美女高潮无套在线观看 | 五月婷婷在线视频 | 天天色综 | 羞羞免费视频 | 91插插插插插插插 | 日韩欧美国产一区二区在线观看 | 欧美性猛交富婆 | 成人在线一区二区三区 | 日韩高清精品免费观看 | 欧美黄色激情视频 | 亚洲高清视频在线 | 超碰成人免费在线 | 无码一区二区三区免费 | 精品久| 91秦先生在线播放 | 91视频插插插 | 欧美日韩在线二区 | 毛片在线免费 | 国产精选视频在线观看 | 91视频三区 | 欧美色亚洲色 | 成人毛片100部免费看 | 丰满熟妇乱又伦 | 国产又粗又猛又黄又爽无遮挡 | a级黄色片免费看 | 国产精品视频久久久久 | 欧美 中文字幕 | 懂色av一区二区夜夜嗨 | 老熟妇午夜毛片一区二区三区 |