nsoutlineview 搜索_阿里巴巴搜索推荐广告三位一体的在线服务体系
最近在工作中大量使用到了淘系的在線分發服務體系,可以快速高效的實現個性化內容分發,其技術架構的概覽在這里分享給大家。
AI·OS(Artificial Intelligence Online Serving)是阿里巴巴集個性化搜索、推薦、廣告三位一體的在線服務平臺。在大型互聯網公司里,使用一套技術來支撐搜索、推薦乃至廣告是比較少見的。之所以能成為統一的AI·OS體系,是因為阿里巴巴把搜索、推薦、信息流、廣告、深度學習這幾項,從技術到業務場景都不同的東西,非常好地結合到了一起,得以形成了有實質內涵,能相互借助合體發力的基礎引擎平臺。
阿里的平臺技術戰略,本質上是兩樣東西,一是電商技術(包括商品管理、類目管理、運營管理、交易鏈路),另一個是和電商配合的大數據 AI 技術的應用。在當今時代,AI的投放、搜索推薦,甚至廣告的投放,已經是獨立于傳統電商的技術場景。
縱觀整個業務場景,可以做如下劃分:
對于技術層面的劃分,由上至下分為三層:
分布式引擎系統需要具備的能力。無論是搜索、推薦、廣告,都需要召回、排序,系統做大之后,需要分布式通信,高性能索引的存儲,要有比較高效率的支持索引靈活構建更新的能力,以上是基礎能力。
深度學習時代沉淀出來的技術要求和場景要求。比如深度學習需要做樣本處理,做訓練,在線預測,同時,與之相應的,是個性化投放,這在搜索、推薦、廣告都有所體現。最后,索引的部分還應該支持實時更新
整個體系內有資源管理,高可用性,相應的計算引擎的支撐,運維的管控和插件的支持。
AI·OS 工程體系技術
在這個組件的最下層是資源的管理,叫 Hippo,是一個非常高效的資源管理系統。
右側是系統里的中間件,是更為基礎的組件,跟實際的業務功能都直接相關。
左側的算法平臺、離線平臺、訓練平臺、計算平臺,是在深度學習時代新的開拓。星云是面向大規模商業化場景的一站式深度學習建模平臺。借助星云,用戶可以快速完成從特征引入、樣本特征變換,到模型訓練及評估,再到模型交付整個算法建模閉環。在此基礎上,星云提供了完善的數據模型校驗體系,確保用戶的離線建模和模型交付具備生產級別的可靠性。星云支持全量學習、增量學習和在線學習,并通過高層抽 象實現了各種學習模式之間的低成本切換。XDL是以開源框架為基礎,面向廣告、搜索、推薦等場景打造的分布式深度學習框架,針對高維稀疏特征、互聯網結構化數據和結構化模型進行了專門設計與優化。
中間在線服務和業務密切相關。HA3 搜索引擎的服務是阿里云最經典的具有全文本檢索能力的引擎。商業化引擎,是與 HA3 相對應的,支持廣告業務、關鍵詞匹配帶廣告,或者支持定向場景投放的召回引擎。iGraph 圖引擎,是具備在線圖計算和圖檢索能力,在業界規模較大的圖檢索引擎,它里面具備的用戶個性化關系、知識圖譜的在線推導能力都是很大規模的。這些引擎都是支持數據實時更新的,這個能力的來源就是AI·OS Framework,支持對數據的管理,對更新的管理,是對右側整套技術的依賴,也有延伸出來的深度學習的能力。預測引擎 RTP,把 TensorFlow 的能力集成進來,讓深度大模型支持實時更新,充分利用實時數據分布,提升 CTR/CVR 預估精度,獲取業務效果。模型特征支持實時更新,模型可以增量訓練,通過對 RTP 在線 graph 分解,提取可更新模型 weights 成最大不連通可執行子圖,實時發送模型數據消息,真正實現了模型離線流式訓練,在線實時更新的效果。TPP(The Personalization Platform,阿里個性化平臺)為集團眾多的個性化業務提供開放、一致的解決方案,讓搜索、推薦技術輕松服務于業務發展,業務也能快速得在平臺找到需要的技術,是 AI·OS(Online Serving)大數據深度學習在線服務體系中的入口之一。
在線服務技術架構演進
AI·OS 在線服務架構,對逐步走向規模化的初創公司,具備一定的參考意義。
在 2013 年至 2015 年期間主要在搜索引擎上做性能優化,在阿里體系內部做搜索引擎平臺化。搜索搭建主要是運用比較經典的架構——Query 的處理+搜索引擎+摘要服務,Query 的部分,會有一些個性化存儲,當時是用簡單的 KV 來完成。這個架構是很多初創型企業選用的架構,也是云產品提供的一個經典解決方案。
2015 年到 2018 年,隨著信息流業務的進入,將搜索底層(Suez 或 AI·OS framework)數據抽象沉淀出來,在沉淀的數據上面,衍生了圖引擎、預測引擎、搜索引擎、推薦引擎,形成了今天 AI·OS 的主體框架。
2018 年~2019 年,推進了全圖化的架構。在業務邏輯調整、場景迭代、功能調整,如粗排、精排、統計、過濾這些功能,都用圖化的方式來表達,在業務迭代效率上,有了質的飛越。
隨著集團內部進一步貫徹中臺戰略,不管是在軟件的抽象,還是在能力的衍生,都需要在云上發揮。踐行平臺化、通用化的思路,用最高效的方式解決問題,并打造出了海神(一站式選品投放系統)、開放搜索(一站式內容智能搜索服務)等經典應用產品。
AI·OS 云原生產品與實踐
依托于 AI·OS 體系構建的產品矩陣如下所示。
開放搜索(OpenSearch)源于阿里巴巴 AI·OS 體系技術,是免運維、一鍵式的云上平臺,將搜索平臺服務化、產品化,完全屏蔽了搜索系統的底層復雜度,以標準化產品的方式支持業務。
智能推薦(AIRec)提供一站式的個性化推薦服務,服務使用者在提交內容和用戶行為,在確保數據保密的前提下,按照不同行業的模板,應用個性化推薦算法,實時調整效果,為用戶提供服務。
還有圍繞開源生態的 Elasticsearch,由阿里巴巴和 Elastic 公司合作推出。將 Elasticsearch 的靈活易用和阿里巴巴調度管控系統的穩定高效相結合,并根據用戶需求,不斷迭代自研的創新性功能.
在后續文章,我將通過展示這些系統的具體使用方法,歡迎大家關注。
[1]淘系千人千面分發體系全拆解 https://developer.aliyun.com/topic/download?spm=a2c6h.12873639.0.0.a7253263pFVo5c&id=8619&Signature=nqC%2Fc8BvldkxgJ21cQBlOgQe7Kk%3D
總結
以上是生活随笔為你收集整理的nsoutlineview 搜索_阿里巴巴搜索推荐广告三位一体的在线服务体系的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java常见GC算法_垃圾收集器及内存分
- 下一篇: 手机java软件_浅谈软件开发就业前景