日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

排序算法有哪些_超强整理,科班算法岗的秋招之路

發布時間:2024/9/19 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 排序算法有哪些_超强整理,科班算法岗的秋招之路 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

NewBeeNLP原創出品

作者?|?葉先生

面試錦囊之面經分享系列,持續更新中?

歡迎后臺回復"面試"加入討論組交流噢?

寫在前面

首先說一下本人背景:算法崗,科班,本碩都是某 985。有一段兩個半月的大廠非核心部門實習經歷,一篇冷門方向的 SCI 一區期刊論文,一個小比賽的 TOP5。(實習比賽論文都有,但每樣都一般般,所以秋招也是十分艱難)

秋招結果:投遞了大大小小 30 多家公司,目前是拿到一份意向書。

  • 意向書:字節(經歷了一次筆試掛,一次三面掛,再被撈三面后上岸的)
  • 泡池子:京東物流,華為,360,OPPO(其中 360 和 OPPO 已經開過部分獎了,我應該排序比較靠后或者掛了)
  • 終面掛或者排序掛:網易互聯網,百度提前批,拼多多拼越計劃
  • 二面掛:阿里(二面完后很久狀態都沒改變),百度正式批,騰訊 PCG
  • 一面掛:美團,快手
  • 進行中:騰訊音樂,網易互娛

還有一些投了之后沒消息或者筆試完后沒消息,這里就不列出來了。

項目相關提問

項目相關提問我只列舉一下可能對大家有借鑒意義的問題。

  • 有沒有觀察單個特征和標簽之間的聯系
  • 每次加入一個特征,如果效果沒有提升則不使用該特征。那怎么處理特征組合的問題。(組合后可能變好或者差)
  • ID embedding 怎么做
  • 項目中 Embedding 學習到的是什么,特征交叉的作用是什么
  • 為什么使用 DeepFM 來進行特征交叉
  • DeepFM 和 Deep&Wide 區別,寫一下 FM 公式,DeepFM 優點
  • DeepFM 只是簡單的交叉,其他復雜點的對特征進行交叉的網絡了解嗎
  • 你說你發現了訓練集和測試集分布不一致的問題。你是怎么發現這個問題的,怎么診斷定位,除了可視化還有沒有其他直觀的指標
  • 對于一個算法課題,你覺得最重要的幾個環節有哪些。
  • 項目遇到了什么困難,如何解決?
  • 項目取得了啥效果,項目的核心提升是哪些操作
  • 項目中使用了哪些特征?如果要繼續改進的話,還可以使用哪些特征?
  • 有沒有使用其他更好的算法來解決問題
  • 你覺得你實習做的項目還有哪些地方可以做優化
  • 項目遇到瓶頸,反映在業務上是怎么樣的,你要怎么去解決這個問題
  • 有沒有調研過業界的做法
  • 你的比賽任務,四分類,評估指標用 auc 合理嗎
  • 比賽的 LSTM 和 CNN 是怎么用的,為什么可以用。講一下 RNN 和 CNN 的區別,為啥在你這個比賽中 LSTM 比 CNN 效果好
  • 機器學習基礎相關提問

    特征相關

  • 講一下特征工程
  • 類別特征編碼方式有哪些?如何解決 target encoding 的 target leakage?count encoding 有個缺點:測試集和訓練集分布不同,導致特征頻率不一樣。怎么解決?
  • 如何進行特征選擇
  • 項目中如何做交叉特征,為什么這樣交叉,基于業務意義?
  • 為什么需要計算特征重要性,計算特征重要性的方法有哪些
  • 連續特征怎么分箱,如何判斷分箱的結果是好是壞
  • 特征平滑方法有哪些
  • 怎么處理長尾問題,從樣本,模型的角度來看,從優化器的角度來看
  • 什么樣的 ID 經過 Embedding 后可能有效,如何篩選有效的 ID。有些 ID 數量級很大,怎么處理
  • 神經網絡相關

  • 神經網絡如何跳出局部最優
  • 神經網絡如何緩解過擬合, 講一下 dropout,dropout 訓練和預測的時候有什么不同, dropout 操作類似于機器學習中的什么操作
  • batch normalization 和 layer normalization 區別,寫一下 bn 公式
  • 優化器了解哪些,adam 相對 sgd 的改進
  • 激活函數的作用,各個激活函數的優缺點
  • tf 處理特征的類有沒有了解( tf.feature_column)
  • 講一下 word2vec,有哪兩種形式,詞的數量比較多,分類時怎么優化, word2vec 怎么做負采樣
  • item2vec 有沒有了解
  • 多分類如果有 10000 類別,怎么優化
  • graph embedding 了解嗎,神經網絡做 graph embedding 了解嗎
  • 講一下圖神經網絡
  • tf embedding_lookup 原理
  • 文本分類有了解嗎,說一下 textcnn
  • 如何緩解 RNN 的梯度消失
  • 講一下 LSTM。LSTM 為啥能緩解梯度爆炸和梯度消失?LSTM 激活函數可以使用 relu 嗎
  • 排序算法了解嗎?說了快排,歸并,冒泡等(后面發現好像問的是 ctr 中的排序算法)
  • 了解哪些推薦算法,nlp 的預訓練模型了解嗎,attention, transformer,bert 了解嗎
  • CNN 和 RNN 在實際使用中有哪些優缺點?NLP 中,什么情況下使用 CNN,什么情況下使用 RNN?
  • 神經網絡權重全 0 初始化會有什么問題?應該怎樣初始化?講講 Xavier 初始化
  • 樹模型相關

  • 樹模型怎么處理連續特征
  • 隨機森林的隨機性體現在哪里?boosting 和 bagging 區別。隨機森林是不是樹越多越好。隨機森林采樣是有放回采樣還是無放回采樣
  • c4.5 用來解決 ID3 什么問題,gbdt 和 rf 分別是集成的什么思想,解決什么誤差
  • GBDT 怎么生成一個新的樹,怎么確定葉子節點的權重
  • 隨機森林和 xgboost 那個樹的深度更深
  • XGBoost 和 GBDT 的不同,為啥 XGBoost 選擇決策樹作為基分類器?
  • XGBoost 和 GBDT 分裂葉子節點的不同之處,寫一下 XGBoost 計算節點分裂收益的公式
  • XGBoost 如果損失函數沒有二階導,該怎么辦
  • GBDT 和 XGBoost 用什么基分類器,如何分裂葉子節點,處理分類問題和回歸問題有啥不同
  • Lightgbm 相比于 XGBoost 的改進,LightGBM 為什么比 GBDT 快。LightGBM 怎么做并行
  • 看過 XGBoost, Lightgbm 等的源碼沒?(沒有。。)
  • 講一下 bagging,boosting,stacking
  • stacking 和 nn 的區別?(nn 也可以搭積木,拼接)
  • 其他相關

  • 哪些算法需要對特征先進行歸一化,這類算法有什么特點,不進行歸一化的缺點是?
  • 如何解決過擬合,講一下 L1 和 L2,L1 為啥能得到稀疏解
  • 如何處理樣本不平衡
  • 分類和回歸任務有哪些評估指標
  • 寫 huber loss 公式
  • auc 是啥,怎么解釋。如果線下 auc 好,線上 auc 變差,有什么可能的原因
  • auc 針對的是單個值的排序,那么怎么對 list 進行排序(ndcg ?)
  • 多分類 auc 怎么算
  • 交叉熵公式
  • LR 的損失函數是啥,怎么來的,手推 LR
  • LR 如何優化目標函數
  • SVM 和 LR 區別
  • 為什么 LR 使用交叉熵而不是 MSE
  • 講一下先驗,后驗,最大似然估計,最大后驗估計
  • 拋一次硬幣,正面為上,是啥分布。拋 n 次硬幣,正面為上的數目是啥分布
  • 廣義線性回歸了解么
  • 排序,操作系統,數據結構,計網

    這方面問得比較少

  • 快排時間復雜度
  • 排序算法了解哪些,講一下快排和堆排,堆排適用于哪些場景
  • 講一下哈希表,哈希表用什么數據結構實現,怎么解決哈希沖突,哈希表數組空間大小怎么確定
  • 線程,進程是啥,進程間通信方式,如何保證線程安全
  • 多進程和多線程區別,各自的適用場景,線程安全怎么解決,有哪些鎖,樂觀鎖悲觀鎖了解嗎,自旋鎖適用于什么場景
  • TCP 協議了解嗎
  • 編程語言,大數據相關

    Hive 相關

  • 了解 Spark,Hadoop,Hive,Scala 嗎?(我基本不會,實習時寫過一些簡單的 Hive SQL)
  • Hive SQL 大表 join 小表,可以怎么優化
  • Hive sql union 和 union all 區別,行轉列和列轉行了解嗎
  • Hive 讀取 json 某個 key 對應的值
  • Hive 數據傾斜怎么處理
  • Python 相關

  • 說一下 Python 中的 lambda
  • Python copy 和 deepcopy 區別, if a 和 if a is not None 區別
  • Python is 和 == 區別,兩者分別在比較什么?Python 沒有 switch... case.. ,如何優雅地實現
  • Python 有哪些對象類型,哪些是可變對象,哪些是不可變對象
  • Python 中,li = [0,1,2] ,那么 li[3] 和 li[:3] 分別返回什么
  • Python 寫過多線程嗎
  • 字典有 key, value,按照 value 進行排序
  • 手撕

    鏈表相關

  • 鏈表翻轉
  • 合并兩個有序鏈表
  • 判斷鏈表是否有環,返回環的入口
  • 樹相關

  • 無序數組轉二叉搜索樹
  • 兩個樹節點的最近公共祖先
  • 二叉樹先序遍歷展開成鏈表 in-place
  • 無序數組轉平衡二叉搜索樹(不能先對數組進行排序)
  • 給你兩顆二叉樹 a,b(只有數的結構而沒有 value),判斷a 是否 b 的子樹(只需要 b 的某個子樹結構跟 a 一樣就行),能否繼續優化?
  • DFS,BFS

  • 打印字符串所有子序列
  • 字符串全排列(字符串可能有重復元素)
  • 迷宮問題,迷宮里有多個人處于不同位置,每個人逃出迷宮有最短路徑值,求這些最短路徑值的最大值
  • 劃分為 k 個相等的子集:給定一個整數數組 nums 和一個正整數 k,找出是否有可能把這個數組分成 k 個非空子集,其總和都相等
  • 排序,大小

  • 子數組最大和
  • 子矩陣和的最大值
  • 兩個有序數組的中位數
  • 求數組的第 k 大數,時間復雜度是多少?
  • 讀取文本,統計,然后排序(有多個排序因素)
  • 一個數組只包含0,1,2三個數,對這個數組進行排序
  • 最大數組合:給定一個非負整數數組,求一個拼接出來的最大數。比如 [2, 32] => 322
  • DP

  • 股票最大利潤(只能交易一次)
  • 走樓梯方法數,一次可以走一個臺階或者兩個臺階,總共有 n 個臺階
  • 01數組,長度為 n,1代表可達,0 代表不可到達,一次可以跳 3 到 5 步。求跨越該數組的最小步數(起點可以看成 index 為 -1,終點可以看成 index 為 n)
  • 其他

  • 順時針打印二維矩陣
  • 升序數組,求不同絕對值個數
  • 二維平面判斷一個點是否在三角形以內
  • 給定數組,計算有多少個子數組和為 target
  • 怎么編程求幾何平均值,需要考慮什么情況,怎么解決
  • 提供東西視圖和南北視圖,求城市體積最大值,最小值,leetcode 807 變種
  • 正整數數組滿足 2 * a[i] < a[i+1],給定數字 K,數組中是否存在兩個數 x + y = K
  • 協同過濾中,需要計算用戶相似度矩陣。給定用戶 ID,每個用戶的聽歌列表(music id 列表)。計算用戶相似度矩陣
  • 給一個數據表,有兩個字段(user, login_time),用 SQL 求連續兩天登錄的用戶占比
  • 場景題,開放題

  • 在搜索框輸入文字的時候,會出現搜索提示,比如輸入‘騰訊’可能會提示 ‘騰訊視頻’。你覺得搜索提示是用什么數據結構來實現的
  • 學校門口的十字路口車流量預測,怎么建模?(已有歷史車流量數據)
  • 年齡預測(范圍 10 到 50),目標是最大化準確率,怎么設計損失函數?如果要求預測結果在正負 3 以內就行,怎么設計損失函數,如何優化?
  • 有個商品庫,商品庫記錄的車的型號,最低價格,最高價格(沒有精準價格)。當前用戶在瀏覽某個商品,要求推薦同個檔次的商品,如何建模?假如商品庫很大,要推薦相似度最大的 3 個商品,如何解決?
  • 定義兄弟字符串如下:若兩個字符串存在一樣的字符,每個字符次數都一樣,但是順序有可能不同。比如 abbc 和 acbb 是兄弟字符串,abbc 和 acb 不是。現有一個很大的日志文件,每一行是一個單詞。問題:給定一個單詞,查詢日志文件中該單詞兄弟字符串有多少個。有多次查詢操作。
  • 怎么給 50 w 高考考生成績排序,要求時間空間復雜度盡可能低
  • 一副撲克牌,取出一張,剩下的 53 張給你看,如何判斷抽出的是哪一張(要求時間,空間復雜度最優)
  • 一個超級大文件,每一行有一個 ip 地址,內存有限,如何找出其中重復次數最多的 ip 地址
  • 有一款新游戲,怎么識別出土豪(可能在新游里充大量錢的用戶)
  • 提供一個包含所有英文單詞的字典,為手機的T9輸入法設計一個索引,例如輸入4能夠提示出g、h、i開頭的英文單詞(greate、hello、……),輸入43能夠提示出ge、he、id、if (hello……) 等詞開通的英文單詞,
  • 一起交流

    重磅推薦!NewBeeNLP目前已經建立了多個不同方向交流群(機器學習 / 深度學習 / 自然語言處理 / 面試交流 / 大廠內推?等),趕緊添加下方微信加入一起討論學習吧!

    -?END?-

    預訓練模型超全知識點梳理與面試必備高頻FAQ 2020-10-10 百度 | 一份遲來的提前批機器學習面經 2020-09-25 算法面試大亂斗 2020-09-14

    記得把NewBeeNLP設為星標哦

    等你在看

    總結

    以上是生活随笔為你收集整理的排序算法有哪些_超强整理,科班算法岗的秋招之路的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。