“文心一言”领路,百度全面提速
文 | 一橙
出品 | 網(wǎng)易科技《態(tài)℃》欄目組
今日,百度發(fā)布了2022年第四季度及全年財報,并釋放明確信號——計劃將多項主流業(yè)務(wù)與“文心一言”進行整合。
從財報數(shù)據(jù)來看,百度各項業(yè)績表現(xiàn)十分穩(wěn)健。2022年,百度實現(xiàn)營收1236.75億元,歸屬百度的凈利潤(非美國通用會計準(zhǔn)則)206.8億元,同比增長10%。第四季度,百度實現(xiàn)營收330.77億元,歸屬百度的凈利潤(非美國通用會計準(zhǔn)則)53.71億元,同比增長了32%。2022財年,百度核心連續(xù)四個季度業(yè)績超市場預(yù)期。
隨后百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏發(fā)布內(nèi)部信表示,百度3月份推出新一代大語言模型文心一言,將與多項主流業(yè)務(wù)整合,百度加速增長的方向已經(jīng)明確。
圖片來源:百度
當(dāng)下,全世界互聯(lián)網(wǎng)都刮起了一陣ChatGPT風(fēng),其中鉆研AI能力十年的百度,以及其將推出的大語言模型“文心一言”,被市場寄予最大厚望。業(yè)內(nèi)討論,隨著“文心一言”的推出,百度或?qū)⑦M入業(yè)績修復(fù)的快車道,成為中國科技賽道的絕對C位。
值得關(guān)注的是,為什么百度最有可能在中國做出千億參數(shù)級別的大語言模型?“文心一言”未來將為百度業(yè)務(wù)帶來賦能和想象力?
一、開發(fā)大語言模型“文心一言”,百度不是從零開始
由OpenAI推出的通用型對話機器人ChatGPT持續(xù)引發(fā)全球范圍的“AI狂歡”。一時之間,資本圈、產(chǎn)業(yè)界、創(chuàng)業(yè)者趨之若鶩,試圖抓住技術(shù)紅利,引領(lǐng)下一個時代。
在趕超ChatGPT的巨大產(chǎn)業(yè)機遇下,國內(nèi)大小企業(yè)打響了追平基礎(chǔ)大模型差距的“攻堅戰(zhàn)”。
2月7日,百度對外證實正在打造生成式AI產(chǎn)品文心一言(英文名ERNIE Bot),位于模型層,在做上線前的沖刺準(zhǔn)備工作,預(yù)計三月份完成內(nèi)測,面向公眾開放。除百度外,還有快手、京東、360、商湯、美圖等均趁勢宣布正積極發(fā)展AI聊天機器人,或在AIGC有所布局。
實際上,這場全球新一輪AI技術(shù)競賽,投入門檻和研發(fā)難度都極具挑戰(zhàn)性。
ChatGPT火爆的同時,其背后的成本支出也引發(fā)業(yè)內(nèi)的關(guān)注。作為OpenAI早期投資人的埃隆·馬斯克在推特平臺提問ChatGPT“每次聊天的平均成本是多少”。OpenAI的CEO山姆·阿爾特曼回復(fù)稱,ChatGPT平均每次的聊天成本為“個位數(shù)美分”,并表示正在試圖更加準(zhǔn)確地計算。
資深人工智能研究專家田濤源曾告訴網(wǎng)易科技,“GPT3.5訓(xùn)練一次需要花費300-460萬美金,還只是算力的成本,沒算人才的成本,Open AI一共375人左右,一年工資開支就要2億美金,AI算力開支5億美元,需要雄厚的資本支撐。”
除了如此高的資金和能源門檻,最具挑戰(zhàn)性的是能夠駕馭千億參數(shù)的技術(shù)實力。
ChatGPT在對語言進行分析和理解時,需要有參數(shù)支持,類似于神經(jīng)網(wǎng)絡(luò),初代ChatGPT就有超過40億個參數(shù),而上一代GPT-3已經(jīng)有1750億個參數(shù)。有數(shù)據(jù)稱,國內(nèi)實驗室目前做過的模型大多是在10億個參數(shù),也就是ChatGPT是國內(nèi)模型的175倍。
同時,ChatGPT能在自然語言處理、文本生成和人機對話上有驚艷的表現(xiàn),除去硬件支持外,大量數(shù)據(jù)獲取下的語料庫建立也很關(guān)鍵,中文語料內(nèi)容全面性也成為了挑戰(zhàn)。
對于這些掣肘難題,百度并不是從零開始突破。大語言模型產(chǎn)品最顯著的幾個關(guān)鍵詞——AI、NLP、搜索,也都是百度的標(biāo)簽。
數(shù)據(jù)顯示,過去10年,百度研發(fā)投入超1000億元。從算力、算法到數(shù)據(jù),從高端芯片昆侖芯,到飛槳深度學(xué)習(xí)框架,再到文心預(yù)訓(xùn)練大模型,百度在各個層面都早有關(guān)鍵自研技術(shù),給百度即將發(fā)布的生成式對話產(chǎn)品文心一言,提供了強大的技術(shù)支持。
以深度學(xué)習(xí)框架這個人工智能的底層操作系統(tǒng)為例,百度飛槳已超過谷歌TensorFlow在國內(nèi)市場排名第一。IDC發(fā)布《中國深度學(xué)習(xí)框架和平臺市場份額,2022H2》報告,顯示,百度居中國深度學(xué)習(xí)平臺市場綜合份額第一。
在ChatGPT火爆全球之前,2021年9月,百度發(fā)布了PLATO-XL,曾一舉超過Facebook Blender、谷歌Meena和微軟 DialoGPT,成為全球首個百億參數(shù)中英文對話預(yù)訓(xùn)練生成模型,刷新了開放域?qū)υ捫Ч?/p>
同時,搜索起家的百度,坐擁千億級全網(wǎng)索引和覆蓋超過50億實體的中文知識圖譜。百度文心系列大模型在行業(yè)已普遍應(yīng)用,截至2022年11月,文心已累計發(fā)布11個行業(yè)大模型,涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、制造、社科等領(lǐng)域,加速推動行業(yè)的智能化轉(zhuǎn)型升級。
但無論是AIGC,還是ChatGPT,AI技術(shù)最終會變成什么樣的產(chǎn)品,還有很多不確定性。如李彥宏曾經(jīng)說過的:“把這么酷的技術(shù)變成人人需要的產(chǎn)品才是最難的。”
二、“文心一言”領(lǐng)路,百度智能云提速
毋庸置疑,生成式AI所需要的巨大算力需求以及對云業(yè)務(wù)的賦能,正成為云廠商不容錯過的新戰(zhàn)場,AI也成為了云計算下半場競逐的關(guān)鍵變量。
ChatGPT以及其背后的基礎(chǔ)大模型,不僅能給出更準(zhǔn)確的結(jié)果,還有更強的通用性和泛化能力,被認為是一項面向未來的先進生產(chǎn)力,讓世界看到人工智能技術(shù)進化,這讓其成為了AIGC生態(tài)最值得關(guān)注的能力,也被認為AIGC長期價值的重要增長點。
大洋彼岸,微軟已宣布將OpenAI整合進微軟云服務(wù)中。ChatGPT不僅將會接入微軟旗下的搜索引擎必應(yīng)(Bing),還將整合OpenAI的技術(shù)以改進Office應(yīng)用,并強調(diào)將通過微軟的云服務(wù)提供ChatGPT。
與微軟將 ChatGPT接入 Azure的思路類似,百度智能云宣布將在5月推出針對文心一言模型的 API 接口,吸引大量企業(yè)和機構(gòu)客戶使用百度智能云提供的API和基礎(chǔ)設(shè)施,搭建AI模型、開發(fā)應(yīng)用,調(diào)用文心一言的能力來解決不同場景里的具體問題。
在云業(yè)務(wù)上,百度和微軟都高舉著AI大旗。
去年底,百度同樣提出了“AI大底座”這個概念,簡單來說,百度作為云計算廠商將標(biāo)準(zhǔn)化地輸出智能化的底層能力,把芯片、大模型、深度學(xué)習(xí)框架等高門檻的技術(shù),變成像水電一樣供客戶按需取用。
IDC《2022 H1中國AI云服務(wù)市場研究報告》報告顯示,2022H1,在AI公有云服務(wù)市場份額占比28.1%,已連續(xù)四年市場份額第一。
“在產(chǎn)業(yè)智能化浪潮來臨之際,百度正處于前所未有的最佳位勢,百度智能云憑借著‘云+AI’戰(zhàn)略發(fā)展迅猛。”李彥宏認為智能化對各行各業(yè)效率的提升比技術(shù)更重要,“ChatGPT是AI技術(shù)發(fā)展到一定階段后的新機會,怎么賦能千行百業(yè),讓他們的生產(chǎn)效率大幅度地提升?這一步才是最難的,也是最偉大、最能夠產(chǎn)生影響力的。”
未來的云市場中,竟?fàn)帉⒃絹碓骄劢怪悄埽恢皇谴鎯捄退懔Α?/p>
百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖表示,“文心一言”是基于百度智能云技術(shù)打造出來的大模型,它將根本性地改變云市場的游戲規(guī)則,云服務(wù)將從數(shù)字時代躍遷到智能時代。以前企業(yè)選擇云廠商更多是看算力、存儲等基礎(chǔ)云服務(wù),以后企業(yè)對云的需求會更加聚焦智能服務(wù),會更多看框架好不好、模型好不好,以及模型—框架—芯片—應(yīng)用這四層架構(gòu)之間的協(xié)同是否高效。”
目前,至少有300家知名企業(yè)宣布接入文心一言,涵蓋互聯(lián)網(wǎng)、媒體、金融、保險、汽車、企業(yè)軟件等行業(yè),包括愛奇藝、攜程、長虹、海信等已成為生態(tài)合作伙伴。
隨著“文心一言”生態(tài)拓展,百度智能云將在云市場獲得更大話語權(quán),并贏下更多的市場空間。
3、 搜索變革,來勢洶洶?
財報顯示,目前,百度移動生態(tài)流量強勁,依然是貢獻經(jīng)營利潤和現(xiàn)金流的重要來源。第四季度百度移動端搜索查詢次數(shù)和信息流分發(fā)量繼續(xù)實現(xiàn)同比兩位數(shù)的增長。12月,百度App月活躍用戶達到6.48億,同比增長4%。
對智能搜索賽道而言,類ChatGPT的引入,或?qū)⒋俪善錈òl(fā)全新的生命力。
在AI技術(shù)的不斷升級和迭代中,ChatGPT讓人們看到了搜索引擎的另一種可能:AI搜索引領(lǐng)的生成式答案。比如,針對開放式問題,ChatGPT可以通過匹配網(wǎng)絡(luò)中的數(shù)據(jù)生成較為完整的答案,在處理知識類以及創(chuàng)意類的問題時,ChatGPT甚至可以幫助人們更高效率的獲取靈感,提供的搜索體驗優(yōu)于目前的傳統(tǒng)搜索引擎,這讓使得眾人看到搜索引擎的下一代模樣。
目前,ChatGPT最顯性的價值與落地場景,也正是搜索。
微軟將ChatGPT整合進必應(yīng)搜索,谷歌也計劃在其搜索引擎中添加高級人工智能功能。有報道稱,百度搜索今年在技術(shù)上最重要的工作就是要把整個檢索系統(tǒng)變成檢索+生成雙模系統(tǒng),并將百度版ChatGPT嵌入到百度主要的搜索服務(wù)中,實現(xiàn)搜索代際變革。
百度很早之前就意識到,生成式AI和搜索引擎是互補關(guān)系。
早在2015年,百度就提出了多模搜索概念,探索從文本搜索向語音、視覺、視頻等多模態(tài)搜索延伸。在百度App中,早可以進行語音搜索、拍照搜索、實時翻譯、植物識別、視頻搜索等操作。
在百度Create AI開發(fā)者大會前夕,百度搜索就宣布將基于百度自研的生成式模型,升級“生成式搜索”能力,并指出,生成式AI和搜索引擎是互補關(guān)系而不是替代,搜索底層技術(shù)和AI底層技術(shù)是相通的。
更值得想象的是,以ChatGPT為代表的智能生成技術(shù)在應(yīng)用場景上也不斷創(chuàng)新,除了智能對話、寫文章、寫代碼外,智能生成技術(shù)應(yīng)用還可以作畫、作曲、制作電影,且應(yīng)用范圍還在進一步探索,為百度獲得極大豐富的內(nèi)容生態(tài)和供給,將產(chǎn)生里程碑式的革命。
未來,依托AIGC賦能,百度搜索將開創(chuàng)更廣闊的想象力,實現(xiàn)搜索能力的高速進化,也將為大眾提供更優(yōu)質(zhì)、高效的搜索體驗。
根據(jù)投行瑞銀集團發(fā)布的一份研究報告顯示,爆紅聊天機器人ChatGPT的月活躍用戶在2023年1月份預(yù)計達到1億,這距離它推出只有兩個月時間,其成為史上增長最快的消費者應(yīng)用。
目前百度擁有6.48億的月活,“文心一言”落地后,短時間內(nèi)勢必大幅拉升百度搜索MAU,吸引到更多的用戶,產(chǎn)生新的流量入口,進一步優(yōu)化用戶體驗,有望為百度搜索帶來商業(yè)價值的快速增長。
在李彥宏看來,AI技術(shù)已經(jīng)發(fā)展到一個臨界點,各行各業(yè)都不可避免地被改變。中國AI市場即將迎來爆發(fā)性的需求增長,其商業(yè)價值的釋放將是前所未有的、指數(shù)級的。
他在內(nèi)部信中也提到:文心一言與搜索整合,將引領(lǐng)搜索體驗的代際變革;文心一言將通過百度智能云對外提供服務(wù),根本性地改變云計算市場的游戲規(guī)則;此外,文心一言大模型還將搭載到Apollo智艙系列產(chǎn)品,并與小度進行集成。
可以想象,隨著“文心一言”的推出,百度將進入業(yè)績提速的快車道。
總結(jié)
以上是生活随笔為你收集整理的“文心一言”领路,百度全面提速的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CentOS6.5系统重启后宕机
- 下一篇: iOS上传头像, 相册权限,相册权限,拍