日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

20201014 《人工智能与大数据》第1节课 笔记

發布時間:2025/3/15 编程问答 15 豆豆
生活随笔 收集整理的這篇文章主要介紹了 20201014 《人工智能与大数据》第1节课 笔记 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄

  • 課程相關
  • 推薦書籍
  • 在n個數中查找出現次數超過一半的數字
  • 在n個數中尋找出現次數最多的k個數字
  • 估計n個數中出現次數最多的k個數字的出現次數
  • 布隆過濾器

課程相關

李榮華 lironghuabit@126.com
主頁 ronghuali.github.io
課程考核 大作業(綜述)

推薦書籍

  • 王宏志,大數據算法,機械工業出版社,2015
  • Jure Leskovec, Anand Rajaraman, Mining of Massive Datasets edition
  • 中文版:大數據-互聯網大規模數據挖掘與分布式處理,王斌 譯,人民郵電出版社

在n個數中查找出現次數超過一半的數字

使用一個桶,數據按順序進桶,如果桶中無數字,該數據進桶,且計數1;如果桶中有數字,且與當前數字不同,計數器減一;如果桶中有數字,且與當前數字相同,計數器加一。當計數器為零時,桶清空。最終,桶中留下的數字即為最頻繁的數字。

在n個數中尋找出現次數最多的k個數字

  • Misra-Gries算法
    對于每個元素x:①若存在統計x的計數器,該計數器加一;②若不存在統計x的計數器,且計數器個數小于k,新建統計x的計數器且初始化為1;③若不存在統計x的計數器,且計數器個數為k,所有計數器數值減一,刪除數值為零的計數器。最終,k個計數器統計的x則為出現次數最多的數字,且計數器的值可作為對應數字的出現次數的估計值。

估計n個數中出現次數最多的k個數字的出現次數

在Misra-Gries算法中,執行步驟③會丟棄k+1個數字(k個計數器減一,且當前數字沒有加入計數)。我們可以計算最終得到的k個計數器內值的和,并記為n‘。則,最多進行了(n-n‘)/(k+1)次步驟③。因此,元素出現次數的估計值比真實值最多小(n-n‘)/(k+1)

布隆過濾器

作用:查詢一個數據是否在數據集中。

總結

以上是生活随笔為你收集整理的20201014 《人工智能与大数据》第1节课 笔记的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。