聊聊AI浏览器
提供AI咨詢+AI項(xiàng)目陪跑服務(wù),有需要回復(fù)1
大模型一直有個(gè)難以解決的問(wèn)題:系統(tǒng)的知識(shí)是過(guò)時(shí)的,他們難以跟進(jìn)最新的信息。
基于這個(gè)原因,ChatGPT以及DeepSeek都提出了聯(lián)網(wǎng)功能,只不過(guò)效果嘛絕不可能太好(絕不會(huì)有用會(huì)從CSDN搜尋程序員要的答案):
AI應(yīng)用團(tuán)隊(duì)的話,一般會(huì)使用爬蟲(chóng)到各個(gè)目標(biāo)網(wǎng)站整理信息,提前存入到知識(shí)庫(kù),以保證AI應(yīng)用的先進(jìn)性,只不過(guò)這在特定領(lǐng)域是適用的,如果是泛?jiǎn)栴},知識(shí)庫(kù)沒(méi)有信息的話,模型依舊會(huì)胡說(shuō)八道。
在這個(gè)基礎(chǔ)上,事實(shí)上各個(gè)AI應(yīng)用團(tuán)隊(duì)對(duì)AI瀏覽器是有訴求的,于是就有很多公司在做相關(guān)功能:
- 2023年:Opera推出Aria,內(nèi)置AI助手,支持網(wǎng)頁(yè)內(nèi)容摘要和實(shí)時(shí)回答;
- 2024年:微軟Edge推出Copilot,嵌入生成式AI,提升生產(chǎn)力;
- 2025年:Brave推出Leo,支持網(wǎng)頁(yè)自動(dòng)摘要和多功能助手;
其實(shí),RAG的本質(zhì)和搜索引擎是很類(lèi)似的,也可以將AI瀏覽器理解為一個(gè)MCP應(yīng)用,提供給AI產(chǎn)品調(diào)用即可。
PS:拋開(kāi)瀏覽器提供接口給我使用這個(gè)點(diǎn),我其實(shí)已經(jīng)想不到太多瀏覽器的生存空間了,
我只有在不想看AI回答的情況下,才會(huì)去用搜索,而且一定不是瀏覽器搜索...
以上是AI瀏覽器誕生的一些背景,以及我的一些認(rèn)識(shí),接下來(lái)我們來(lái)具體的了解其中一些表現(xiàn)不俗的AI瀏覽器。
從Arc到Dia
The Browser Company 成立于2019年,融資1個(gè)多億,估值5.5億美金。
其核心產(chǎn)品是Arc,一款被極客喜愛(ài)的瀏覽器,被認(rèn)為遠(yuǎn)超Chrome的用戶體驗(yàn)。
而在24年完成5000萬(wàn)美金融資后,其毅然決然的放棄了Arc的研發(fā)投入,開(kāi)始轉(zhuǎn)向?yàn)?strong>全新的AI瀏覽器研發(fā)。
同年,Dia瀏覽器發(fā)布,這也是現(xiàn)在被認(rèn)為非常優(yōu)秀的AI瀏覽器:
AI不會(huì)以一個(gè)應(yīng)用或者一個(gè)按鈕的形式存在,它將是一個(gè)全新的環(huán)境——建立在網(wǎng)頁(yè)瀏覽器之上的。
這句話透露出一種堅(jiān)定的信念:AI將不再是我們?nèi)缃袼?jiàn)的簡(jiǎn)單工具,而是將徹底重塑我們與技術(shù)互動(dòng)的方式,成為一個(gè)無(wú)處不在、深度融合的全新生態(tài)。
在使用之前,瀏覽器會(huì)搜集很多個(gè)人傾向性信息:
我猜測(cè),他會(huì)根據(jù)用戶的喜好,返回最合適的信息。
只不過(guò)使用下來(lái),不知道是不是錯(cuò)覺(jué),感覺(jué)跟Manus想要達(dá)到的體驗(yàn)很類(lèi)似...
這其實(shí)都還是在走OpenAI的L3路徑:
L1級(jí)別(聊天機(jī)器人)。AI系統(tǒng)能夠進(jìn)行基本的對(duì)話和交流,顯示出對(duì)自然語(yǔ)言的基本理解能力,并能對(duì)各種提示和問(wèn)題作出響應(yīng)。
L2:推理者(Reasoners)。AI系統(tǒng)能夠以人類(lèi)專家的熟練程度解決復(fù)雜問(wèn)題,標(biāo)志著其從單純模仿人類(lèi)行為升級(jí)到展現(xiàn)真實(shí)的智能水平。這些AI不僅擅長(zhǎng)對(duì)話,更具備了解決問(wèn)題的能力,其推理和決策能力已接近人類(lèi)水平。
L3:智能體(Agents)。AI系統(tǒng)能夠承擔(dān)復(fù)雜的任務(wù)、作出決策和適應(yīng)不斷變化的環(huán)境,并在無(wú)須持續(xù)人類(lèi)監(jiān)督的情況下自主行動(dòng)。這一階段的AI不僅具備推理能力,更能自主執(zhí)行各類(lèi)復(fù)雜的操作任務(wù)。
與其說(shuō)他是瀏覽器,不如說(shuō)他是智能體...
AI需要瀏覽器
事實(shí)上,AI需要的不是瀏覽器,AI需要的是最新的知識(shí)庫(kù),并且真人使用的瀏覽器與AI想要的瀏覽器非常不一樣。
比如Manus團(tuán)隊(duì)之前就想打造一款適應(yīng)于AI的瀏覽器,以便AI產(chǎn)品的體驗(yàn)更好,最終他們也確實(shí)這么做了,這里以我的理解來(lái)說(shuō)的話,與其說(shuō)做了一個(gè)AI瀏覽器,倒不如說(shuō)做了一個(gè)適應(yīng)于AI使用的知識(shí)庫(kù)。
綜上,事實(shí)上我們是不需要AI瀏覽器的,我們只需要AI Agent,是AI Agent需要一個(gè)適應(yīng)于他的瀏覽器(更確切的說(shuō)是知識(shí)庫(kù)),比如browser-use、Nova Act SDK。
只不過(guò),瀏覽器是極其重要的關(guān)鍵詞,因?yàn)樗且粋€(gè)非常好的入口,入口代表著流量,流量意味著爭(zhēng)奪,所以很多公司都在開(kāi)始布局AI瀏覽器,其本質(zhì)其實(shí)在爭(zhēng)奪下一個(gè)Agent入口...
事實(shí)上,從The Browser Company宣布放棄旗艦產(chǎn)品Arc、轉(zhuǎn)投Dia研發(fā)時(shí)就是一個(gè)非常重要的信號(hào):瀏覽器已不再是單純的網(wǎng)頁(yè)容器,而正在經(jīng)歷從"工具"到"智能體"的躍遷。
當(dāng)AI出現(xiàn)那一刻,就宣布了傳統(tǒng)瀏覽器的死亡,因?yàn)槿蠛诵慕换フ谧兓?/p>
- 信息獲取方式:從"用戶主動(dòng)搜索"轉(zhuǎn)向"Agent預(yù)判需求";
- 交互界面:從"URL+網(wǎng)頁(yè)"轉(zhuǎn)向"多模態(tài)對(duì)話空間";
- 底層架構(gòu):從"頁(yè)面渲染引擎"轉(zhuǎn)向"實(shí)時(shí)數(shù)據(jù)處理器";
微軟Edge Copilot的代碼自動(dòng)補(bǔ)全功能已展示這種轉(zhuǎn)變:當(dāng)開(kāi)發(fā)者輸入注釋時(shí),AI直接調(diào)用GitHub最新代碼庫(kù)生成解決方案,整個(gè)過(guò)程無(wú)需打開(kāi)任何技術(shù)文檔網(wǎng)站...
入口之爭(zhēng)
隨著AI Agent的崛起,科技巨頭紛紛布局,爭(zhēng)奪下一代用戶“入口”。現(xiàn)在有兩類(lèi)玩家:
傳統(tǒng)玩家
對(duì)于已有入口占領(lǐng)者,會(huì)發(fā)揮好本來(lái)優(yōu)勢(shì):
- 微軟:將Copilot深度植入Windows內(nèi)核,實(shí)現(xiàn)系統(tǒng)級(jí)Agent調(diào)用;
- 谷歌:通過(guò)Gemini重構(gòu)Chrome,搜索結(jié)果直接呈現(xiàn)動(dòng)態(tài)生成的3D模型演示;
- 蘋(píng)果:Siri升級(jí)為Proactive Agent,可跨設(shè)備預(yù)測(cè)用戶行為軌跡;
新秀玩家
與此同時(shí),各種新興勢(shì)力也在沖擊這一領(lǐng)域:
- Dia瀏覽器:通過(guò)實(shí)時(shí)屏幕語(yǔ)義分析,在用戶點(diǎn)擊前預(yù)加載所需信息;
- Manus智能體:首創(chuàng)"認(rèn)知沙盒"技術(shù),可并行運(yùn)行多個(gè)Agent處理復(fù)雜任務(wù);
- Nova Act SDK:提供跨平臺(tái)Agent運(yùn)行時(shí),打破瀏覽器與本地應(yīng)用的界限;
這些公司通過(guò)不斷擴(kuò)展AI Agent的能力,推動(dòng)用戶體驗(yàn)的提升,爭(zhēng)奪用戶的核心“入口”,這個(gè)行為不再局限于操作界面,而是進(jìn)入了工作流、決策支持和深度集成的層面。
具體到行業(yè)應(yīng)用,AI Agent在各領(lǐng)域中的應(yīng)用正以驚人的速度改變傳統(tǒng)的用戶體驗(yàn)。
例如,在醫(yī)療行業(yè),AI Agent能夠分析患者的病史、癥狀,并根據(jù)最新的醫(yī)學(xué)研究提出精準(zhǔn)的治療建議。
在教育領(lǐng)域,AI Agent通過(guò)個(gè)性化學(xué)習(xí)路徑幫助學(xué)生提高成績(jī),在金融行業(yè),AI Agent可以幫助金融顧問(wèn)根據(jù)實(shí)時(shí)數(shù)據(jù)做出投資決策。
在這些應(yīng)用中,AI Agent的存在不再是“工具”,而是用戶的“合伙人”。用戶不再只是被動(dòng)接受信息,而是通過(guò)AI Agent主動(dòng)獲取、分析和執(zhí)行任務(wù),這使得用戶體驗(yàn)變得更加智能化、動(dòng)態(tài)化。
盡管AI Agent的前景廣闊,但它的發(fā)展仍面臨諸多挑戰(zhàn)。其中包括如何解決隱私保護(hù)問(wèn)題、如何確保數(shù)據(jù)安全、以及如何實(shí)現(xiàn)算法的透明性等...
總結(jié)
- 上一篇: debug与DOSBox安装&&
- 下一篇: codeup之C语言10.1+C语言10