日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

春招快到了,送你一份数据分析常见面试题

發布時間:2025/3/15 编程问答 54 豆豆
生活随笔 收集整理的這篇文章主要介紹了 春招快到了,送你一份数据分析常见面试题 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.



找了半年工作,面試了幾個data science的職位,總結了一些常見的問題,在這兒拋磚引玉。



自我介紹


幾乎所有的面試都免不了以自我介紹為開頭。對于考官,通常也會想基于自我介紹發現接下來要問的問題。所以,自我介紹非常重要。我參考的模板:


教育背景:簡單說說哪年在哪里獲得什么學位。


相關經驗:按時間順序講一下2個做過的項目,介紹下用了什么辦法,比如用了什么編程語言,最后的成果是什么。最好有些量化的指標,比如發表了多少論文,被引用了多少次。這些項目最好和面試的職位有關系。實在沒有,也可以看看從中學到的知識或者技能可否擴展到data science. 比如之前做過信號處理,可以講這個項目為data science打下了統計基礎。


最自豪的成就和表態:介紹一下自己最自豪的項目,關鍵是要點出自己的優勢,比如迅速掌握了一個很大的代碼庫,或者在代碼庫中加入了一個很有用的特性,并再次強調一下自己的優勢,結尾說,我希望能在XX公司繼續發揮這些優勢。





被問過的問題總結


機器學習(Machine learning)算法


包括算法對數據的假設,推導,有什么優缺點,何時改用什么算法,怎么選擇算法,很類似P2 student intervention的model選擇問題。


作為入門的參考書:Introduction to Data Mining?(Pang-Ning Tan, Michael Steinbach, Vipin Kumar);


復雜一點兒的:The Elements of Statistical Learning?(Trevor Hastie, Robert Tibshirani , Jerome Friedman)


相關的算法可能包括:


Classification / Regression

  • SVM:是很多考官的最愛,最好做到可以推導

  • Neural Networks

  • Trees & ensemble methods: boosting, bagging

  • Clustering

  • K-means/median/medoids

  • Spectral clustering

  • Hierarchical

  • DBSCAN: density based spatial clustering of applications with noise

  • Self organizing map

    Association:?這個在Udacity沒有介紹,但是大數據可能會用到

    Apriori 以及它對大數據的衍生

    FP growth 并行實現



其他算法問題:


1、Q-learning: 解釋為什么update Q value的時候要用下一個state的max Q,為什么不能用mean?

2、Kalman filter: 在項目中用到了,要求推導

3、Expectation maximization



關于大數據的問題


1、很多職位要求的數據量,要遠遠大于Udacity的項目,所以會牽扯到一些大數據相關的問題

2、參考書:Mining of Massive Datasets?(Jure Leskovec, Anand Rajaraman, Jeff Ullman)?
免費的下載:http://infolab.stanford.edu/~ullman/mmds/book.pdf

3、算法:

  • Finding similar items

  • Find frequent itemsets

  • Recommendation systems

  • Social graph mining

    關于大數據的問題:

  • 用過的數據量有多大

  • GPU的相關經驗?

  • Hadoop是怎么讀入很大的數據的? 接受HDFS?

  • Spark的相關項目,用的什么model和library

  • Spark: RDD相關的概念

  • Spark: 如果數據遠遠大于內存,是怎么處理的?

  • 是否遇到過這樣的情景:通過對數據的初步分析,觀察到有趣的現象?

  • Spark: 舉例說明inner join, outer join, etc.

    其他網上看到的常見問題:

  • Support, confidence, and lift

  • What is curse of dimensionality?

  • A/B testing

  • Precision, recall, F1

  • How to handle missing data?


來源:優達學城


精彩活動

福利 · 閱讀 | 免費申請讀大數據新書 第23期

推薦閱讀

2017年數據可視化的七大趨勢!?

全球100款大數據工具匯總(前50款)?

論大數據的十大局限

大數據時代的10個重大變革

大數據七大趨勢 第一個趨勢是物聯網


Q:?今年,你準備換工作嗎?

歡迎留言與大家分享

請把這篇文章分享給你的朋友

轉載 / 投稿請聯系:hzzy@hzbook.com

更多精彩文章,請在公眾號后臺點擊“歷史文章”查看

總結

以上是生活随笔為你收集整理的春招快到了,送你一份数据分析常见面试题的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 色乱码一区二区三区熟女 | 中文字幕免费高清在线 | 亚洲国产精品久久人人爱 | 成人性视频网站 | 亚洲29p| 天天摸日日操 | 亚洲第5页 | 成人交性视频免费看 | 三级视频在线观看 | 136福利视频导航 | 狠狠做深爱婷婷综合一区 | 日本亚洲网站 | 影音先锋男人的天堂 | 亚洲天堂热 | 欧美俄罗斯乱妇 | 97视频播放 | 午夜激情在线 | 亚洲欧美一区二区精品久久久 | 尤物视频免费观看 | 欧美精品久久久久久久多人混战 | 二男一女一级一片 | 黄色大片视频网站 | 乱码av| 夜夜嗨老熟女av一区二区三区 | 国产乱码久久久久久 | 91精品国产自产91精品 | 亚洲偷怕| 青青国产视频 | 国产一级特黄aaa大片 | 日本午夜影院 | 天天曰夜夜操 | 91se在线 | 久久久人妻无码一区二区 | 久久人人爽人人爽人人片 | 美人被强行糟蹋np各种play | 欧美国产日韩一区 | 中文字幕在线字幕中文 | 精品美女一区二区三区 | 亚洲区小说 | 玖玖色在线 | 国产日韩成人 | 国产午夜视频在线播放 | 欧美极品在线视频 | 国产成人精品久久二区二区91 | 肥臀熟女一区二区三区 | 最新av观看| 法国空姐电影在线 | 38在线视频 | 久久刺激 | 在线亚洲成人 | 国产观看 | 国产丝袜在线播放 | 日韩成人免费 | 亚洲69视频 | 国产乱淫av公 | 欧美日韩精品在线播放 | 草逼导航 | 欧美综合在线一区 | 四虎精品在永久在线观看 | 免费三级大片 | 蜜桃久久一区二区三区 | 国产91色在线 | 性――交――性――乱 | 久久久久一级片 | 精品乱码一区二区三区 | 露脸丨91丨九色露脸 | 九九热国产精品视频 | 久久艹免费视频 | 天堂av一区 | 九九精品视频免费 | 亚洲毛片在线免费观看 | 国产ts在线观看 | 久久综合社区 | 国产精品成人一区二区 | 我要看18毛片| 欧美精品一区视频 | 在线观看污 | 操小妹影院 | avtt2015 | 国产精品100 | 久久99网站| 制服丝袜成人动漫 | 国产社区在线 | 亚洲精品1234| 日韩资源在线 | 欧美成人精品一区二区 | 东北女人啪啪ⅹxx对白 | 少妇2做爰交换朴银狐 | 欧美一级片在线看 | 特黄特色大片免费播放器使用方法 | 97香蕉 | 日本在线观看 | 国产特黄级aaaaa片免 | 欧美丰满老熟妇xxxxx性 | a级黄色影院 | 琪琪久久 | 六月婷婷色 | 久久国产主播 | av在线不卡网 |