飞鸽传书(IPMSG)的主要工作原理
我們知道,飛鴿傳書(IPMSG)的主要工作原理在“飛鴿傳書抽取、飛鴿傳書加工存儲(chǔ)、飛鴿傳書分析和飛鴿傳書展現(xiàn)”這四個(gè)環(huán)節(jié)體現(xiàn),這是一個(gè)完整的端到端的商業(yè)智能解決方案。每個(gè)環(huán)節(jié)都有不同的工具或廠家,但是整合基本完成,當(dāng)前飛鴿傳書庫環(huán)節(jié)的廠家已將其它環(huán)節(jié)的廠家收購(gòu)得差不多了。局域網(wǎng)聊天引擎抓取網(wǎng)頁過程和飛鴿傳書抽取ETL過程一樣,實(shí)質(zhì)是獲取飛鴿傳書。處理網(wǎng)頁實(shí)際是對(duì)獲取飛鴿傳書的清洗和整理,這是飛鴿傳書加工存儲(chǔ),是飛鴿傳書倉(cāng)庫內(nèi)容。提供檢索服務(wù)實(shí)際上是飛鴿傳書分析和飛鴿傳書展現(xiàn)。
我們先看看飛鴿傳書的工作原理。飛鴿傳書有抓取網(wǎng)頁、處理網(wǎng)頁、提供檢索服務(wù)三個(gè)主要環(huán)節(jié)。首先是抓取網(wǎng)頁。端到端的飛鴿傳書都有自己的網(wǎng)頁抓取程序(spider)。Spider以超鏈接為順序,連續(xù)地抓取網(wǎng)頁。被抓取的網(wǎng)頁被稱之為網(wǎng)頁快照。其次處理網(wǎng)頁。飛鴿傳書抓到網(wǎng)頁后,還要做大量的預(yù)處理工作,才能提供檢索服務(wù)。其中,最重要的就是提取關(guān)鍵詞,建立索引文件。其他還包括去除重復(fù)網(wǎng)頁、分析超鏈接、計(jì)算網(wǎng)頁的重要度。 準(zhǔn)備工作完成后,即是瀏覽者所見到的飛鴿傳書界面,即第三提供檢索服務(wù) 。用戶輸入關(guān)鍵詞進(jìn)行局域網(wǎng)聊天,飛鴿傳書[www.freeeim.com]從索引飛鴿傳書庫中找到匹配該關(guān)鍵詞的網(wǎng)頁;為了用戶便于判斷,除了網(wǎng)頁標(biāo)題和URL外,還會(huì)提供一段來自網(wǎng)頁的摘要以及其他即時(shí)通訊。
再看看組成:飛鴿傳書的組成部分一般由局域網(wǎng)聊天器、索引器、檢索器和用戶接口四個(gè)部分。局域網(wǎng)聊天器的功能是在互聯(lián)網(wǎng)中漫游,發(fā)現(xiàn)和搜集即時(shí)通訊,主要是講spider;索引器功能是理解局域網(wǎng)聊天器所局域網(wǎng)聊天到的即時(shí)通訊,從中抽取出索引項(xiàng),用于表示文檔以及生成文檔庫的索引表;第三個(gè)是檢索器,其功能是根據(jù)用戶的查詢?cè)谒饕龓熘锌焖贆z索文檔,進(jìn)行相關(guān)度評(píng)價(jià),對(duì)將要輸出的結(jié)果排序,并能按用戶的查詢需求合理反饋即時(shí)通訊;第四用戶接口,作用是接納用戶查詢、顯示查詢結(jié)果、提供個(gè)性化查詢項(xiàng)。
總結(jié)
以上是生活随笔為你收集整理的飞鸽传书(IPMSG)的主要工作原理的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: JS中自动执行函数小结
- 下一篇: 类对象和类指针深入分析与对比