统计学基本知识四
代碼可以參考之前的博客:
https://blog.csdn.net/fanzonghao/article/details/85643653
https://blog.csdn.net/fanzonghao/article/details/81637669
聲明:文中的圖來自于可汗學院公開課,若有侵權,聯系我刪除。
線性回歸:二維坐標上有n個點,存在一條直線y=mx+b,其中誤差error(1)=y1-(mx1+b),,,error(n)=y(n)-(mx(n)+b),直線的平方誤差SE(line)=error1^2+...+error(n)^2,求相應的m、b的值使SE最小。
決定系數:
描述的是X波動對Y波動的影響度。
決定系數 R平方 = 1 - SE line (Y對于回歸線距離的平方和)/ SE Y均 (Y對于 Y平均值距離的平方和)。
當R平方接近于1時,說明直線擬合的很好。
協方差:covariance 兩隨機變量離各自均值之積的期望值。
cov(x,y)=E[(x-E[x])(y-E[y])] 上述展開化簡可得 E(xy)-E(x)*E(y)
線性回歸的斜率m=COV(X,Y)/COV(X,X)
卡方分布:即從標準正態分布:X~N(0,1)中隨機抽樣,對每個抽樣的隨機變量平方。所有隨機取一個隨機變量平方的,服從自由度為1卡方分布;隨機取2個隨機變量平方的,服從自由度為2的卡方分布。
方差分析:
自由度等于m*n-1
總方差=組內方差+組間方差,自由度也是兩者的相加。
相關性與因果性:
相關性是指兩個或多個事物同時發生,具有關聯;因果性是指因為A所以B,兩者具有明顯的差異。
歸納推理:尋找規律或趨勢然后推廣,也就是用已有信息進行趨勢外推;
演繹推理:則是從一些數據或事實出發。
不同點:歸納推理在推廣時,并不確定趨勢是否會繼續,只是假設它會繼續。演繹推理是從事實出發得到其他事實。
?
總結
- 上一篇: pytorch实现常用的一些即插即用模块
- 下一篇: Pyinstaller打包Django项