简述isodata算法的原理_算法常见面试题汇总(一):概率论与数理统计部分
初級或中級算法崗面試題主要有四類:數(shù)理統(tǒng)計基礎(chǔ)、機器學(xué)習(xí)模型原理、編程能力、項目經(jīng)驗。項目經(jīng)驗因人而異,所以僅總結(jié)前三個方面的基礎(chǔ)知識,分享給朋友。(高級或資深算法崗面試內(nèi)容不在本文范圍內(nèi))
1.大數(shù)定律
弱大數(shù)定律:獨立同分布的n個隨機變量,當n充分大時,n個隨機變量的均值依概率收斂于數(shù)學(xué)期望值,即可以用均值代替數(shù)學(xué)期望值。
伯努利大數(shù)定理:獨立重復(fù)試驗次數(shù)足夠大時,事件A發(fā)生的頻率收斂于概率。注:以上為口頭簡述,非標準化的數(shù)學(xué)表述。
2.中心極限定理
n個獨立同分布的隨機變量,當n充分大時,其均值服從正態(tài)分布。注:以上為口頭簡述,非標準化的數(shù)學(xué)表述。
3.條件概率/分布律(乘法公式)
P(A|B)=P(AB)/P(B),演化式P(A|B)*P(B)=P(B|A)*P(A)
4.全概率公式
P(A)= P(A|B1)+P(A|B2)+P(A|B3)+…+P(A|Bn),其中A為樣本空間的事件,B1、B2、B3…Bn為樣本空間的一個劃分。
5.貝葉斯公式
P(Bi|A)= P(A|Bi)*P(Bi)/[P(A|B1)+P(A|B2)+P(A|B3)+…+P(A|Bn)],其中A為樣本空間的事件,B1、B2、B3…Bn為樣本空間的一個劃分。
6. 常見三大正態(tài)抽樣分布
7. 參數(shù)檢驗(總體分布已知的情況下,對參數(shù)取值的檢驗)
8. 非參數(shù)檢驗(總體分布形式未知情況下的檢驗)
(3) 偏度、峰度檢驗
9. 置信區(qū)間
注:單側(cè)置信區(qū)間省略
10. 模型擬合優(yōu)度
(4)A/Btest Score
(5)殘差檢驗:一般要求殘差分布接近正態(tài)分布。
寫在最后:原理和思想很重要,一定要理解透徹!!!
“數(shù)學(xué)算法的世界”專注數(shù)據(jù)分析、數(shù)據(jù)科學(xué)技能傳播,后期會陸續(xù)推出數(shù)據(jù)分析、數(shù)據(jù)科學(xué)面試題匯總系列文章,敬請關(guān)注!
往期回顧
在數(shù)據(jù)分析/科學(xué)中的競爭力如何?一張圖幫你讀懂數(shù)據(jù)科學(xué)需要掌握的技能
抖音日活3.2億,可能有 3.3億用戶在同一天內(nèi)使用抖音嗎?(泊松分布的Python實現(xiàn))
常見數(shù)據(jù)分析(Python)面試題(一)
什么影響了你的工資?方差分析告訴你
我放棄了國企工作,轉(zhuǎn)行做了數(shù)據(jù)分析
總結(jié)
以上是生活随笔為你收集整理的简述isodata算法的原理_算法常见面试题汇总(一):概率论与数理统计部分的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hive安装超详细教程
- 下一篇: 计算机管理员账户权限不足,用户权限不足,