微软开放必应搜索引擎核心算法
https://www.toutiao.com/a6691434638826537486/
?
5月15日;微軟宣布了開源了部分必應(yīng)搜索引擎的核心算法,能快速的將搜索結(jié)果反饋給用戶。通過開放這項技術(shù);微軟希望開發(fā)人員能夠利用這項技術(shù)為其他用戶搜索大量數(shù)據(jù)的用戶提供類似的體驗。
?
普通的用戶可能不清楚;其實我們在使用百度和其他搜索引擎,本質(zhì)上是利用百度提供api接口去檢索我們想要的數(shù)據(jù),要知道在海量的數(shù)據(jù)中篩選出我們想要的數(shù)據(jù)是非常困難的,尤其是能做到毫秒級的響應(yīng)。其背后的核心算法,是由一群數(shù)據(jù)科學(xué)家團隊維護的。
今天開源的軟件是微軟開發(fā)的一個庫,它可以更好地利用它收集的所有數(shù)據(jù),為Bing 引擎構(gòu)建的 AI 訓(xùn)練模型。該算法稱為空間分區(qū)樹和圖(SPTAG),使用開源的 Python 庫為核心;允許用戶利用深度學(xué)習(xí)模型的智能來搜索數(shù)十億條信息,可以實現(xiàn)毫秒級的“矢量”搜索;用于更快地向用戶提供更相關(guān)的結(jié)果。
?
“矢量搜索”可以更好低理解用戶意向,而不是根據(jù)關(guān)鍵字匹配。例如,如果用戶輸入“巴黎的塔樓有多高?” Bing可以返回一個自然語言結(jié)果,告訴用戶 埃菲爾鐵塔是 1,063 英尺,即使搜索查詢中沒有出現(xiàn)“埃菲爾”這個詞,結(jié)果中也沒有出現(xiàn)“高”這個詞。
矢量化工作已經(jīng)擴展到搜索引擎索引的超過1500億條數(shù)據(jù),從而改進了傳統(tǒng)的關(guān)鍵字匹配。這些匹配包括單個單詞,字符,網(wǎng)頁代碼段,和其他媒體圖片。一旦用戶搜索后,可以快速準(zhǔn)確的提供搜索結(jié)果。
?
總結(jié)
以上是生活随笔為你收集整理的微软开放必应搜索引擎核心算法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 我的父亲母亲
- 下一篇: 手把手教你玩转QQ的原创表情