面试总结-百度(2)
生活随笔
收集整理的這篇文章主要介紹了
面试总结-百度(2)
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
百度數(shù)據(jù)挖掘部門
? ? ?跟一面隔了差不多一個(gè)星期,收到了二面的通知,這次不是去百度大廈,是去科技園。第一次來(lái)科技園,發(fā)現(xiàn)這里還是一片工地,有很多大的IT公司,看到漢王科技、IBM之類的。
? ? ?面試官是一個(gè)三十五歲左右的一個(gè)看似像是部門leader的人。拿著電腦,邊面試邊處理工作,氛圍比一面的時(shí)候輕松了許多。先是問(wèn)了下基本情況,比較感興趣實(shí)驗(yàn)室是做什么的。然后指出了我在一個(gè)項(xiàng)目中使用的機(jī)器學(xué)習(xí)的錯(cuò)誤,一看就是行家。一直微笑著提各種尖銳的問(wèn)題。了解大致情況后開(kāi)始做題。
題目
(1)數(shù)據(jù)處理題目 ? ? ? ? ? ? ? ? 已知n個(gè)順序打散的用戶行文,ID(qq號(hào)),狀態(tài)(1表示上線,0下線),時(shí)間。已知0時(shí)刻再現(xiàn)人數(shù)是x個(gè),求第1時(shí)刻的人數(shù)。答:這道題其實(shí)很簡(jiǎn)單,建立一個(gè)數(shù)組,每?jī)蓚€(gè)時(shí)刻區(qū)間內(nèi),上線就總數(shù)加一,下線就減一。
一開(kāi)始我沒(méi)完全領(lǐng)會(huì)到意圖,采用的方法是求得每個(gè)用戶的上線時(shí)間區(qū)間,然后再找到1時(shí)刻上線的人。經(jīng)過(guò)提示,想到的跟正確答案類似的結(jié),但是因?yàn)槲覜](méi)說(shuō)是用數(shù)組存,我說(shuō)用list,空間復(fù)雜度大了一些。
(2)推薦欄
? ? ? ?假設(shè)搜索的詞是“劉德華”,你該怎樣推薦邊欄的推薦人物。
答:以下是我的答案,判斷重名的可能性,找到是哪個(gè)“劉德華”,根據(jù)搜索頻率可以判斷出來(lái)。 (1)然后給用戶打標(biāo)簽,“歌手”、“演員”等,推薦相關(guān)條目下的高熱度人物。 (2)接著遍歷相關(guān)時(shí)效性新聞,找到同時(shí)出現(xiàn)的關(guān)聯(lián)度高的人物。 (3)遍歷此人出現(xiàn)的網(wǎng)頁(yè),找到關(guān)聯(lián)人物。(期間問(wèn)了如何去噪,比如編輯小王這種,我的回答是可以找到網(wǎng)頁(yè)的第一段內(nèi)容判斷,還有就是根據(jù)比例,盡可能多的遍歷網(wǎng)頁(yè)) (4)根據(jù)貼吧、微博信息,個(gè)人媒體 (5)根據(jù)其它也搜索“劉德華”的人的搜索結(jié)果,也就是一種針對(duì)用戶的協(xié)同過(guò)濾。(答上這個(gè)他很滿意) (6)這條是他加上的,我沒(méi)想到。根據(jù)用戶的點(diǎn)擊反饋,他搜完劉德華,又點(diǎn)了什么人,就推薦什么人。
經(jīng)驗(yàn)是,不要裝逼,踏實(shí)的想怎么實(shí)現(xiàn)需求,花哨的代碼沒(méi)用,主要是效率要高。另外就是,腦子要快,順著提示往上爬。
/********************************
* 本文來(lái)自博客 ?“李博Garvin“
* 轉(zhuǎn)載請(qǐng)標(biāo)明出處:http://blog.csdn.net/buptgshengod
******************************************/
總結(jié)
以上是生活随笔為你收集整理的面试总结-百度(2)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【LeetCode从零单排】No121B
- 下一篇: 【LeetCode从零单排】No133.