20201014 《人工智能与大数据》第1节课 笔记
生活随笔
收集整理的這篇文章主要介紹了
20201014 《人工智能与大数据》第1节课 笔记
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
- 課程相關
- 推薦書籍
- 在n個數中查找出現次數超過一半的數字
- 在n個數中尋找出現次數最多的k個數字
- 估計n個數中出現次數最多的k個數字的出現次數
- 布隆過濾器
課程相關
李榮華 lironghuabit@126.com
主頁 ronghuali.github.io
課程考核 大作業(綜述)
推薦書籍
- 王宏志,大數據算法,機械工業出版社,2015
- Jure Leskovec, Anand Rajaraman, Mining of Massive Datasets edition
- 中文版:大數據-互聯網大規模數據挖掘與分布式處理,王斌 譯,人民郵電出版社
在n個數中查找出現次數超過一半的數字
使用一個桶,數據按順序進桶,如果桶中無數字,該數據進桶,且計數1;如果桶中有數字,且與當前數字不同,計數器減一;如果桶中有數字,且與當前數字相同,計數器加一。當計數器為零時,桶清空。最終,桶中留下的數字即為最頻繁的數字。
在n個數中尋找出現次數最多的k個數字
- Misra-Gries算法
對于每個元素x:①若存在統計x的計數器,該計數器加一;②若不存在統計x的計數器,且計數器個數小于k,新建統計x的計數器且初始化為1;③若不存在統計x的計數器,且計數器個數為k,所有計數器數值減一,刪除數值為零的計數器。最終,k個計數器統計的x則為出現次數最多的數字,且計數器的值可作為對應數字的出現次數的估計值。
估計n個數中出現次數最多的k個數字的出現次數
在Misra-Gries算法中,執行步驟③會丟棄k+1個數字(k個計數器減一,且當前數字沒有加入計數)。我們可以計算最終得到的k個計數器內值的和,并記為n‘。則,最多進行了(n-n‘)/(k+1)次步驟③。因此,元素出現次數的估計值比真實值最多小(n-n‘)/(k+1)
布隆過濾器
作用:查詢一個數據是否在數據集中。
總結
以上是生活随笔為你收集整理的20201014 《人工智能与大数据》第1节课 笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ICCV 2019 运行LCGN遇到的问
- 下一篇: 20201014 《计算感知》第2节课