20201014 《人工智能与大数据》第1节课 笔记
生活随笔
收集整理的這篇文章主要介紹了
20201014 《人工智能与大数据》第1节课 笔记
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
目錄
- 課程相關(guān)
- 推薦書籍
- 在n個數(shù)中查找出現(xiàn)次數(shù)超過一半的數(shù)字
- 在n個數(shù)中尋找出現(xiàn)次數(shù)最多的k個數(shù)字
- 估計n個數(shù)中出現(xiàn)次數(shù)最多的k個數(shù)字的出現(xiàn)次數(shù)
- 布隆過濾器
課程相關(guān)
李榮華 lironghuabit@126.com
主頁 ronghuali.github.io
課程考核 大作業(yè)(綜述)
推薦書籍
- 王宏志,大數(shù)據(jù)算法,機(jī)械工業(yè)出版社,2015
- Jure Leskovec, Anand Rajaraman, Mining of Massive Datasets edition
- 中文版:大數(shù)據(jù)-互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理,王斌 譯,人民郵電出版社
在n個數(shù)中查找出現(xiàn)次數(shù)超過一半的數(shù)字
使用一個桶,數(shù)據(jù)按順序進(jìn)桶,如果桶中無數(shù)字,該數(shù)據(jù)進(jìn)桶,且計數(shù)1;如果桶中有數(shù)字,且與當(dāng)前數(shù)字不同,計數(shù)器減一;如果桶中有數(shù)字,且與當(dāng)前數(shù)字相同,計數(shù)器加一。當(dāng)計數(shù)器為零時,桶清空。最終,桶中留下的數(shù)字即為最頻繁的數(shù)字。
在n個數(shù)中尋找出現(xiàn)次數(shù)最多的k個數(shù)字
- Misra-Gries算法
對于每個元素x:①若存在統(tǒng)計x的計數(shù)器,該計數(shù)器加一;②若不存在統(tǒng)計x的計數(shù)器,且計數(shù)器個數(shù)小于k,新建統(tǒng)計x的計數(shù)器且初始化為1;③若不存在統(tǒng)計x的計數(shù)器,且計數(shù)器個數(shù)為k,所有計數(shù)器數(shù)值減一,刪除數(shù)值為零的計數(shù)器。最終,k個計數(shù)器統(tǒng)計的x則為出現(xiàn)次數(shù)最多的數(shù)字,且計數(shù)器的值可作為對應(yīng)數(shù)字的出現(xiàn)次數(shù)的估計值。
估計n個數(shù)中出現(xiàn)次數(shù)最多的k個數(shù)字的出現(xiàn)次數(shù)
在Misra-Gries算法中,執(zhí)行步驟③會丟棄k+1個數(shù)字(k個計數(shù)器減一,且當(dāng)前數(shù)字沒有加入計數(shù))。我們可以計算最終得到的k個計數(shù)器內(nèi)值的和,并記為n‘。則,最多進(jìn)行了(n-n‘)/(k+1)次步驟③。因此,元素出現(xiàn)次數(shù)的估計值比真實值最多小(n-n‘)/(k+1)
布隆過濾器
作用:查詢一個數(shù)據(jù)是否在數(shù)據(jù)集中。
總結(jié)
以上是生活随笔為你收集整理的20201014 《人工智能与大数据》第1节课 笔记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ICCV 2019 运行LCGN遇到的问
- 下一篇: 20201014 《计算感知》第2节课