日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

UA MATH567 高维统计 专题0 为什么需要高维统计理论?——高维统计理论的常用假设

發布時間:2025/4/14 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 UA MATH567 高维统计 专题0 为什么需要高维统计理论?——高维统计理论的常用假设 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

UA MATH567 高維統計 專題0 為什么需要高維統計理論?——高維統計理論的常用假設

延續前三講對線性判別分析的討論,在高維時,根據中心極限定理
n(Xˉ?μ)→dN(0,Id)\sqrt{n}(\bar X - \mu) \to_d N(0,I_d) n?(Xˉ?μ)d?N(0,Id?)

這說明n∥Xˉ?μ∥22→dχd2n\left\| \bar X - \mu \right\|_2^2 \to_d \chi^2_dn?Xˉ?μ?22?d?χd2?
∥Xˉ?μ∥22~dn→α>0\left\| \bar X - \mu \right\|_2^2 \sim \fracozvdkddzhkzd{n} \to \alpha >0?Xˉ?μ?22?nd?α>0

因此在高維時,正態總體的樣本均值不再是總體均值的一致估計,所以統計中基于樣本均值的方法在高維中都無法得到在經典統計中那樣好的結果。

作為計算成本與模型的performance的trade-off,我們在建立高維模型時會引入稀疏性假設:
s=∣{j:μj≠0}∣<<ds = |\{j:\mu_j \ne 0\}|<<ds={j:μj??=0}<<d

也就是大部分特征都是噪聲,只有很少的特征才是signal;引入這個假設有一些比較明顯的好處,比如我們可以去挖掘數據中的low-dimensional structure作為近似,以降低計算成本提高模型performance;同時這也降低了模型具有統計優良性的門檻。上一講我們討論了hard-threshold與soft-threshold,這兩種方法是定義數據low-dimensional structure的最簡單的方法。比如在variable selection的問題中,best subset algorithm就是hard-threshold,LASSO就是soft-threshold。soft-threshold相比hard-threshold得到的估計量更穩定,因為它是連續函數,而hard-threshold存在兩個斷點,所以估計量會依賴于斷點的位置;但soft-threshold對原估計做了shrink,所以引入了額外的bias。因此后來的penalty有一部分就在致力于結合hard-threshold、soft-threshold的優點,把noise shrink to 0,同時又盡可能保護significant signal不被shrink,比如SCAD就是一個這樣的penalty。


另一個重要的問題是threshold如何選擇。我們之前討論過極值的概率不等式
P(nXˉ(n)≤2log?d)→0P(Xˉ(n)≤2log?dn)→0P(\sqrt{n}\bar X_{(n)} \le \sqrt{2 \log d}) \to 0 \\ P(\bar X_{(n)} \le \sqrt{\frac{2 \log d}{n}}) \to 0 P(n?Xˉ(n)?2logd?)0P(Xˉ(n)?n2logd??)0

因此,如果我們取threshold為2log?dn\sqrt{\frac{2 \log d}{n}}n2logd??,則當μj=0\mu_j=0μj?=0時,它的hard-threshold估計會依概率1一致收斂到0,這就是上一講取λ=2log?dn\lambda = \sqrt{\frac{2 \log d}{n}}λ=n2logd??的理由。如果μj≠0\mu_j \ne 0μj??=0,并且d<enα,α<1d<e^{n^{\alpha}},\alpha<1d<enα,α<1,則2log?dn→0\sqrt{\frac{2 \log d}{n}} \to 0n2logd??0,也就是說signal不會被shrink to 0。

在矩陣與張量中也可以引入low dimensional structure,常用的思路有這幾種:對角陣(比如Nearest Shrunken Centroids)、稀疏性、low rank approximation、low rank+sparse等。


經過專題0的討論,現在我們可以根據特征的維數來理解統計理論了。如果d=o(n)d=o(\sqrt{n})d=o(n?),這就是傳統統計理論的范疇;如果d~nd \sim ndn或者d>nd>nd>n,這就是現代統計或者說高維統計理論的范疇;如果d~enαd \sim e^{n^{\alpha}}denα,這就是ultra-high dimensional理論的范疇。

總結

以上是生活随笔為你收集整理的UA MATH567 高维统计 专题0 为什么需要高维统计理论?——高维统计理论的常用假设的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 麻豆影视国产在线观看 | 欧美成人高清在线 | 理论片午午伦夜理片影院99 | 四虎影视免费永久大全 | 日产精品久久久一区二区 | 野花视频在线免费观看 | 无码人妻精品一区二区蜜桃网站 | 精品国产18久久久久久 | 欧美日韩激情在线 | 国产视频一区二区视频 | 久久曹| 长河落日 | 99情趣网 | 精品国产一二三四区 | 99精品国产一区 | 伊人影院亚洲 | 国产高清在线免费观看 | 欧美成人精品激情在线观看 | 国产精品自偷自拍 | 欧美亚韩一区二区三区 | 精品美女在线 | 成人激情视频在线播放 | 青青操视频在线观看 | 狠狠操狠狠爱 | 欧美成人一级视频 | 深夜免费视频 | a v视频在线播放 | 深夜福利国产精品 | 熟女少妇a性色生活片毛片 亚洲伊人成人网 | 蜜臀av色欲a片无码精品一区 | 亚洲免费高清视频 | 日本吃奶摸下激烈网站动漫 | 老妇裸体性猛交视频 | 婷婷丁香一区二区三区 | 精品午夜一区二区三区在线观看 | 我们的生活第五季在线观看免费 | 日本人极品人妖高潮 | 葵司有码中文字幕二三区 | 一区二区三区日韩欧美 | 欧美日韩国产成人精品 | 日韩欧美xxxx| www.激情网 | 久草老司机 | 国产乱论视频 | 日韩av三级在线观看 | 99超碰在线观看 | 国产超碰97| 国产成人精品一区二区色戒 | 91吃瓜在线| 欧美午夜一区二区三区 | 青青艹在线观看 | 中文字幕在线资源 | 69视频网 | 色肉色伦交av色肉色伦 | 最新色网站 | 日韩精品综合 | 性欧美大战久久久久久久久 | 任我爽在线 | 国产美女明星三级做爰 | 91看片在线看 | 91激情视频在线 | 911国产| 2024国产精品视频 | 91超碰在 | 国产视频一二三区 | 天天干夜夜艹 | 韩国av在线 | 国产美女网站视频 | 韩国av一区二区三区 | 久久精品视频一区二区三区 | 毛片999| 国产精品成人免费一区二区视频 | 五月天丁香在线 | 97视频播放 | 男同av在线观看一区二区三区 | 欧美一区二区三区四 | 午夜小视频在线 | 国产婷婷色一区二区三区 | 91性高潮久久久久久久久 | 日日夜夜艹 | 国产欧美三级 | japanese国产 | 欧美国产二区 | 国产一级视频在线 | 99热免费在线 | 色天天av| 日美毛片 | 黄色私人影院 | 亚洲欧美不卡 | 一本到在线观看 | 99精品自拍| 亚洲h视频在线观看 | 大肉大捧一进一出好爽 | www.国产区| 日本精品一区二区三区在线观看 | 农民工hdxxxx性中国 | 成人wwxx免费观看 | 亚洲区 欧美区 | 影音先锋丝袜美腿 |