【BAT面试现场】如何判断一个数是否在40亿个整数中?
作者
channingbreeze
如需轉載,請聯系原作者授權。
小史是一個應屆生,雖然學的是電子專業,但是自己業余時間看了很多互聯網與編程方面的書,一心想進BAT。
今天他就去BAT中的一家面試了。
簡單的自我介紹后,面試官給了小史一個問題。
【面試現場】
題目:我有40億個整數,再給一個新的整數,我需要判斷新的整數是否在40億個整數中,你會怎么做?
【請教大神】
小史回到學校,把面試的情況和計算機學院的呂老師說了一下。
小史忙拉著呂老師問,為什么我說分8次加載數據,面試官會說太慢了呢?
呂老師:哈哈,從磁盤加載數據是磁盤io操作,是非常慢的,你每次都要加載這么大的數據,還要8次,我估計你找一個數的時間可以達到分鐘甚至小時級了。
小史:那如果是你,你會怎么辦呢?
呂老師:其實面試官已經提示得比較明顯了,他說給你一批機器,就是暗示你可以用分布式算法。你把數據分散在8臺機器上,然后來一個新的數據,8臺機器一起找,最后再匯總結果就行了。
小史:這樣的話能快多少?
呂老師:這樣應該能達到秒級。小史,你可以自己分析分析。
小史:我想想……哦,這樣做的話,因為每臺機器都可以一次性把數據讀入內存,在比較的時候不用來回加載數據了,所以可以節省加載數據的開銷!這真是個好辦法。
【更好方案】
呂老師:其實這并不是最好方法,我這還有一種毫秒級的方法,想不想知道啊?
小史:當然想啊,快教教我。
小史:哦,對哦,這樣我就申請40億個位就好了,新的數轉換成一個位,然后判斷一下這個位是0還是1就行了。
呂老師:小史啊,考慮問題要考慮清楚啊,如果是40億個位,那么這40億個位哪些是0,哪些是1呢?來了一個新的數,怎么判斷是否在40億個位之中?
小史:我想想,對啊,40億個位,40億個數,那么每個位都是1,這。。。
呂老師:其實你可以想想,32位int的范圍,總共就是2的32次方,大概42億多點。所以你可以申請2的32次方個位。
小史:意思是我把整個整數范圍都覆蓋了,哦,對哦。這樣一來,就可以做了,1代表第一個位,2代表第二個位,2的32次方代表最后一個位。40億個數中,存在的數就在相應的位置1,其他位就是0。
呂老師:沒錯,那來了一個新的數呢?
小史:新的數就去找相應的位,比如來了一個1234,就找一下第1234位,如果是1就存在,是0就不存在啦。
呂老師:沒錯,那么這樣的話,需要多大內存呢?
小史:我想想啊,2的32次方個位,相當于2的29次方個字節,哇,才500MB,真是節省了不少內存呢。
小史:這么厲害的算法,你是怎么想到的?
呂老師:其實這是一種非常有名的大數據算法,叫位圖法,英文名叫bitmap。顧名思義,就是用位來表示狀態,從而節省空間。明天正好我有一節課,就講位圖法,你可以來聽一聽。
【呂老師的課】
第二天,呂老師開始上課,他一開始就拋出了小史遇到的面試題。
呂老師:同學們,這道題是BAT公司的一道面試題,大家有什么思路嗎?
話音剛落,蛋哥就站起來回答。蛋哥是呂老師最得意的門生,以思維活躍著稱。
蛋哥:我覺得可以這樣。首先,32位int的范圍是42億,40億整數中肯定有一些是連續的,我們可以先對數據進行一個外部排序,然后用一個初始的數和一個長度構成一個數據結構,來表示一段連續的數,舉個例子。
如果數據是1 2 3 4 6 7……這種的,那么可以用(1,4)和(6,2)來表示,這樣一來,連續的數都變成了2個數表示。
來了一個新數之后,就用二分法進行查找了。
這樣一來,最差情況就是2億多的斷點,也就是2億多的結構體,每個結構體8個字節,大概16億字節,1.6GB,在內存中可以放下。
呂老師:嗯,非常好,不僅給出了方案,還能主動分析空間和可行性。
小史聽完后深感佩服,問題的解決方法絕對不止一種,只要肯動腦筋,即使沒有學過bitmap算法,也能有別的方法來解決問題。
【課后】
下課后,小史又找到呂老師。
呂老師:但是你的理解能力還是很強的,很多東西一聽就懂,這可不是誰都能做到的。
完
01
?微 信 群??
添加小編微信:tangguoyemeng,備注“進群”即可,加入【云計算學習交流群】,和志同道合的朋友們共同打卡學習!
成為群成員,或拉人進群,
還有機會參與紅包抽獎,獲得免費贈書哦~~
02
?征 稿?
CSDN作為國內專業的云計算服務平臺,目前提供云計算、大數據、虛擬化、數據中心、OpenStack、CloudStack、機器學習、智能算法等相關云計算觀點、技術、平臺、實踐、云產業咨詢等服務。CSDN?公眾號也一直堅持「與千萬技術人共成長」的理念,深度解讀行業內熱門技術與場景應用,致力于讓所有開發者保持敏銳的技術嗅覺、對行業趨勢與技術獲得更廣闊的認知。
文章題材
首先你需要關注我們的公眾號“CSDN云計算”,這樣你會更準確了解我們需要的文章風格;
側重于云計算領域相關的文章,可以是技術、運維、趨勢等方面的務實內容;
原創,要求文章有鮮明觀點和看法。
投稿須知
?稿費:根據原創性、實用性和時效性等方面進行審核,通過的文章會發布在本微信平臺。一經采用,我們將支付作者酬勞。酬勞可能不多,這代表的是一個心意,更多是因為愛好,是有識之士抒發胸懷的一種方式;
字數要求:稿件字數以2K-8K為宜,少于2K或多于8K都會一定程度降低閱讀愉悅感;
投稿郵箱:lijy@csdn.net。或者添加微信表明來意,微信號:tangguoyemeng。請備注投稿+姓名+公司職位。
如果咱們的合作穩定又愉快,還可以簽訂合同長期合作哦!
總結
以上是生活随笔為你收集整理的【BAT面试现场】如何判断一个数是否在40亿个整数中?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机策划知识竞赛有创意的主题,【社团活
- 下一篇: 云要闻 | 腾讯在华南建云计算基地;致敬