机器学习面试题(转)
面試了 8 家公司,他們問了我這些機器學習題目……
翻譯 | 王柯凝
出品 | AI 科技大本營(公眾號 ID:rgznai100)
【導讀】今年年初以來,作者一直在印度找數據科學、機器學習以及深度學習領域的工作。在找工作的這三十四天里,他面試了 8 到 10 家公司,其中也包括初創公司、基于服務的公司以及基于產品的公司。作者希望他的面試經驗能夠為求職者提供一些有用的信息,因而撰寫了此文。希望你讀后能夠有所收獲!
首先自我介紹一下:
我在機器學習(語音分析、文本分析和圖像分析領域應用)領域有 4 年以上的從業經驗。總的來說,我認為這個領域的大多數工作職位主要包括文本分析(自然語言處理)和圖像分析(計算機視覺)。很少有公司招聘語音或音頻分析的人才。我現在的目標是應聘一個中高級職位,可以帶領一個深度學習或機器學習團隊做一些有趣的項目。
下面是我在應聘過程中被問到的問題,希望能夠對你有所幫助。
公司一:基于全球性服務的某公司(面試時長:20-25min)
體驗****:除此之外面試官還問了一些問題,但是都把我問懵了,我完全不知道他想聽到什么答案。我一直都想深入的聊一些技術層面的問題,比如訓練一個 tesseract(一款由 HP 實驗室開發由 Google 維護的開源 OCR 引擎)或語言模型,但是他似乎并不感興趣。或許他只是想聽到一些已經實現的成果或者是一個好的解釋,又或者是一些更好的方案。我感覺他們面試一個新手和面試一個有經驗的專業人員之間并沒有什么區別。
公司二:基于全球性服務的某公司(面試時長:40-45min)
在無監督學習中,如何進行文件聚類?
如何找到與某些查詢語句 / 搜索相關的文件?
解釋下 TF-IDF 技術。
根據我的經驗來看,TF-IDF 技術在文件分類或聚類上效果并不好,你將如何改進?
什么是長短期記憶神經網絡(LSTM)? 解釋下其工作原理。
什么是 word2vec 模型?
解釋下 python 中的可變對象和不可變對象。
你在 python 中使用過什么數據結構?
體驗: 整個面試過程都是圍繞著文本相似度提問的,我都順利通過了。但是這次仍舊沒有更深層次的技術探討。或許是公司在文本分析領域有幾個小項目,最終我拿到了公司的 offer。
公司三:基于全球性產品和服務的某公司(面試時長:40min)
** 體驗?:** 還有幾個問題我已經記不清了,這是我第一次在面試中深入談論技術細節,隨后我也拿到了這家公司的 offer。
公司四:成立一年的醫療初創公司(面試時長:50min)
體驗: 還有幾個很好的問題我沒有記住。盡管整個面試過程很不錯,但是我們在一些問題上看法并不一致。并且在面試期間,我發現作為一個初創公司,目前只有 2-3 個人在做 ML、DL 和 DS。最后我沒有面試成功。
公司五:亞馬遜公司(面試時長:50-55min)
體驗: 我面試的是亞馬遜 level 6 的職位。他們的主要關注點是在算法和數學上。但是我并沒有準備數學方面的知識,我只是談論了我所了解的東西,并沒有在數學的細節上做更為詳細的探討,因此面試官認為我并不適合 level 6 的工作。我相信如果你能記住機器學習算法在數學上的通用表示,就可以很輕松的通過亞馬遜技術面試。
公司六:某全球服務巨頭(面試時長:50-55min)
體驗: 我也拿到了這家公司的 offer。事實上,我很喜歡這次技術交流。或許你會覺著這些問題是機器學習和數據科學領域最基礎的問題,但是我感覺面試官可能不是這一領域的,或者是對這個領域的發展了解的并不多。
公司七:全球性商業管理公司(面試時長:25-30min)
體驗: 說實話,這次面試有點水,以至于我沒有認真對待。但是問題問的很不錯。我面試的職位是要帶領一個十五六人的團隊做項目,在這之后是經理面試和 HR 面試。最終他們給我提供了崗位咨詢以及不錯的薪資。
公司八:成立 4 年的生產和服務型公司(60 分鐘)
體驗: 是的,你可能會驚訝這都是些什么問題。巧合的是,我們兩個人的研究領域都是語音分析(尤其是發音識別)。所以整個面試過程一直在圍繞語音分析進行提問。很顯然,面試官很專業,并且給了我一個正面反饋。之后,這家公司給我提供了 AI 解決方案架構師的工作。
一些建議
在這整個求職過程中,我大概和 25-30 位專業人士有過交流,下面是我為讀者以及求職者提出的建議:
- 簡歷很重要。一定要在簡歷中寫清楚你參加過的項目、Kaggle 競賽、獲得的 MOOC 課程證書或者論文。我就是在沒有任何推薦人推薦的情況下接到了亞馬遜的面試電話。你的簡歷是打動 HR 和面試官的利器。
- 自信心和熱情是成功的一半。參加面試時一定要自信,并且向面試官展示出你的熱情(這一點在面試創業公司和基于服務的公司時尤為重要)。
- 不要過于急著回答面試官提出的問題。花些時間組織好答案再回答,如果對問題有不理解的地方,一定要請教面試官。還有就是在面試時一定要冷靜!
- 在解釋概念時一定要恰當的表現自己。舉幾個你已經實現過的項目,并且一定要熟悉簡歷中提到的熟練技能和做過的項目。
- 大多數情況下,面試官都是在尋找這個領域內有經驗的技術人才。如果你在這個領域還是一個新手,在創建簡歷時可以從自己做過的項目開始。你的 GitHub 賬號也很有說服力。除此之外,還可以多參加 Kaggle 競賽和 MOOC 課程。
- 面對面試官的時候,一定要謙虛,注意傾聽面試官的意見,否則你就會被拒之門外。有的時候,使用 R 語言和 Python 語言的人會相互鄙視,你最好不要陷入這種爭論當中,否則也容易被拒。我個人認為 R 語言和 Python 語言都是實現邏輯和概念的工具。
最后,祝大家面試成功!
原文鏈接:
https://appliedmachinelearning.wordpress.com/2018/04/13/my-data-science-machine-learning-job-interview-experience-list-of-ds-ml-dl-questions/
轉載請注明?AIQ - 最專業的機器學習大數據社區?http://www.6aiq.com
轉載于:https://www.cnblogs.com/ciao/articles/10894680.html
總結
以上是生活随笔為你收集整理的机器学习面试题(转)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 上下取整函数的关系以及一些重要性质(附证
- 下一篇: 设备树总结