日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH567 高维统计 专题0 为什么需要高维统计理论?——协方差估计的高维效应与Marcenko-Pastur规则

發布時間:2025/4/14 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 UA MATH567 高维统计 专题0 为什么需要高维统计理论?——协方差估计的高维效应与Marcenko-Pastur规则 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

UA MATH567 高維統計 專題0 為什么需要高維統計理論?——協方差估計的高維效應與Marcenko-Pastur規則

上一講我們介紹了在實驗中,線性判別分析的判別誤差會隨著維度的上升而上升,而經典多元統計理論則認為理論誤差是與維數無關的常數,于是我們得到啟發是我們需要建立適應于高維統計問題的理論。這一講我們從線性判別分析中的協方差估計的角度,討論在高維問題中協方差估計會發生什么與經典多元統計理論不同的現象。

我們假設x1,?,xnx_1,\cdots,x_nx1?,?,xn?是某個ddd維零均值分布的樣本,則樣本協方差為
Σ^=1n∑i=1nxixiT\hat \Sigma = \frac{1}{n} \sum_{i=1}^n x_ix_i^TΣ^=n1?i=1n?xi?xiT?

它是總體協方差的無偏估計。但對于non-asymptotic情形,我們希望知道這個估計的誤差。在隨機矩陣理論中,我們介紹了一些常用的矩陣范數,可以用它們來表示誤差,比如在這個協方差估計的問題中,我們定義估計誤差為樣本協方差與總體協方差之差的算子范數,即
∥Σ^?Σ∥=λ1(Σ^?Σ)\left\| \hat \Sigma - \Sigma \right\| = \lambda_{1}(\hat \Sigma - \Sigma)?Σ^?Σ?=λ1?(Σ^?Σ)

考慮最簡單的一種情況,如果Σ=Id\Sigma=I_dΣ=Id?,那么根據弱大數定律,Σ^\hat \SigmaΣ^會依概率趨近于IdI_dId?,那么Σ^\hat \SigmaΣ^的所有特征值會依概率收斂到1。

Marcenko-Pastur規則
假設d/n→α∈(0,1)d/n \to \alpha \in (0,1)d/nα(0,1),也就是在維數非常高的時候,Marcenko-Pastur規則認為Σ^\hat \SigmaΣ^的特征值的密度滿足:
fMP(λ)∝(tmax(α)?λ)(λ?tmin(α))λf_{MP}(\lambda) \propto \frac{\sqrt{(t_{max}(\alpha)-\lambda)(\lambda-t_{min}(\alpha))}}{\lambda}fMP?(λ)λ(tmax?(α)?λ)(λ?tmin?(α))??

其中
tmin(α)=(1?α)2,tmax=(1+α)2t_{min}(\alpha)=(1-\sqrt{\alpha})^2,\ t_{max}=(1+\sqrt{\alpha})^2tmin?(α)=(1?α?)2,?tmax?=(1+α?)2

這兩個閾值的來源是我們在隨機矩陣部分介紹過的不等式
P(λ1(Σ^)≥(1+d/n+δ)2)≤e?nδ22,?δ≥0P(\lambda_{1}(\hat \Sigma) \ge (1+\sqrt{d/n}+\delta)^2) \le e^{-\frac{n\delta^2}{2}},\forall \delta \ge 0P(λ1?(Σ^)(1+d/n?+δ)2)e?2nδ2?,?δ0

這幅圖是基于這個簡單情形的模擬,左圖參數是α=0.2,n=4000\alpha=0.2,n=4000α=0.2,n=4000;右圖的參數是α=0.5,n=4000\alpha=0.5,n=4000α=0.5,n=4000;灰色部分是特征值的頻率直方圖,黑色實線是Marcenko-Pastur規則的密度。從這個圖可以看出,模擬結果,也就是灰色部分并沒有貼近經典多元統計的結果(收斂到1)反而是與Marcenko-Pastur規則基本相符的,而Marcenko-Pastur規則是一個典型的高維統計理論結果。


作為專題0的結尾,我簡單闡述一下我對經典多元統計理論與高維統計理論的理解。首先這二者作為統計理論,研究的問題其實是一樣的,估計量的一致性、誤差、收斂速率等。但經典多元統計理論假設d<<nd<<nd<<n,也就是在做asymptotic analysis的時候,經典統計認為特征的維數ddd關于樣本量nnn是無窮小量,即d/n→0d/n \to 0d/n0,因此經典統計理論的誤差、concentration inequality等結果與維數是無關的。在高維統計理論中,假設d/n→α∈(0,1)d/n \to \alpha \in (0,1)d/nα(0,1),這個比例會出現在誤差、concentration inequality等結果中,也就是維數對概率分布、對誤差等都是有影響的。

除此之外,經典統計與高維統計還有一個很重要的區別,就是在高維統計中,information is sparse in features,即并不是ddd個特征都是一樣重要的,重要的特征占比非常小,這種特性被稱為sparsity,通常認為重要的特征數目是o(d)o(d)o(d),也就是關于ddd是無窮小量,所以我們總是需要一些技術來做dimensional reduction/feature selection以去除冗余信息提高計算效率。

總結

以上是生活随笔為你收集整理的UA MATH567 高维统计 专题0 为什么需要高维统计理论?——协方差估计的高维效应与Marcenko-Pastur规则的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 亚洲欧美一区二区在线观看 | 久久深夜福利 | 99国产精品一区二区 | 久久99国产精品久久99 | 免费成年人视频在线观看 | 亚洲一区二区三区在线观看视频 | 青青草成人影视 | 亚洲美女黄色 | 中国国产精品 | 少妇第一次交换又紧又爽 | 欧美三级三级三级爽爽爽 | 亚洲无套| 日本综合色 | 中文字幕11页中文字幕11页 | 少妇av片 | 亚洲一区二区美女 | 色综合亚洲 | 欧美一区,二区 | 免费无码不卡视频在线观看 | 三上悠亚在线观看一区二区 | 潘金莲一级淫片aaaaaa播放 | 欧美特级黄色大片 | 日日摸夜夜添夜夜 | 亚洲综合少妇 | 欧洲精品免费一区二区三区 | 欧美成人手机视频 | 午夜精品偷拍 | 肉色丝袜脚交一区二区 | 亚洲欧美在线视频观看 | 国产成人免费 | 欧美一区,二区 | 日韩人妻一区二区三区蜜桃视频 | 捆绑调教sm束缚网站 | 日韩资源站 | 看看黄色片 | 992tv在线成人免费观看 | 另类视频在线观看 | 日韩午夜在线播放 | 91av入口| 国产色播av在线 | 久久99国产精品 | 女仆裸体打屁屁羞羞免费 | 一进一出视频 | 找国产毛片看 | 999精品在线观看 | 色综合天天 | 一区二区欧美精品 | 特级a级片 | 久久免费国产 | 免费黄色入口 | 午夜男人影院 | 在线成人播放 | 欧美激情欧美激情在线五月 | 另类综合在线 | 咪咪av| 久久久久毛片 | 国产一区二区视频在线免费观看 | 免费日韩av| 欧美一级欧美三级在线观看 | 91福利网站 | 日本一区二区三区在线免费观看 | 亚洲精品一区二三区不卡 | 超碰在线观看免费版 | 国产极品粉嫩 | 亚洲男人天堂2017 | 国产真实的和子乱拍在线观看 | www在线看片 | 欧美精品极品 | 色呦呦 | 亚洲黄色小视频 | 日本不卡免费 | 一本在线 | 午夜激情在线播放 | 日本大乳奶做爰 | 18无码粉嫩小泬无套在线观看 | 精品无码一区二区三区在线 | 借种(出轨高h) | 男人和女人日b视频 | 午夜小视频在线播放 | 国产一区二区欧美日韩 | 色屋永久| 欧美大色| av爱爱网站 | 精品国产影院 | 精品一区二区三区在线观看视频 | 另类性姿势bbwbbw | 爽爽窝窝午夜精品一区二区 | 人人妻一区二区三区 | 久久1024| 欧美高清视频一区二区 | 色网av | 一区二区三区美女 | 欧美精品久久久久久久自慰 | 久久久成人精品 | 日本成人免费视频 | 尤物视频免费观看 | 91精品人妻一区二区三区蜜桃欧美 | 国产精品国产三级国产专区51区 | 国产精品二区视频 |