日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH567 高维统计IV Lipschitz组合8 随机投影与John-Lindenstrauss引理

發布時間:2025/4/14 编程问答 22 豆豆
生活随笔 收集整理的這篇文章主要介紹了 UA MATH567 高维统计IV Lipschitz组合8 随机投影与John-Lindenstrauss引理 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

UA MATH567 高維統計IV Lipschitz組合8 隨機投影與John-Lindenstrauss引理

    • John-Lindenstrauss引理
    • Random Projection

John-Lindenstrauss引理

這一講我們介紹一個Lipschitz函數法處理隨機向量的技術的應用。假設在一個機器學習問題中,我們有NNN個樣本,每個樣本有nnn個feature,但是nnn非常大,直接用這么多feature訓練模型不但浪費算力而且影響模型精度,所以我們想做一個投影PPP,把這組nnn維的feature投影到一個mmm維的子空間,我們希望投影前后任意兩個樣本點的差別不會被放大或者縮小,用數學來描述就是假設x,yx,yx,y這兩個nnn維向量分別表示一個樣本,則給定一個很小的正數?\epsilon?,使得
(1??)∥x?y∥2≤∥Px?Py∥2≤(1+?)∥x?y∥2(1-\epsilon)\left\| x-y \right\|_2 \le\left\| Px-Py \right\|_2 \le (1+\epsilon)\left\| x-y \right\|_2(1??)x?y2?Px?Py2?(1+?)x?y2?

其中Px,Py∈RmPx,Py \in \mathbb{R}^mPx,PyRm,站在理論機器學習研究者的角度,我們比較關心的一個問題是最小能把feature的維數壓縮到多少?J-L引理認為基于Haar測度的隨機投影下最小的維數是O(ln?N)O(\ln N)O(lnN)


John-Lindenstrauss引理
X\mathcal{X}X表示NNN個樣本,X?Rn\mathcal{X} \subset \mathbb{R}^nX?Rn??>0\forall \epsilon>0??>0?C>0\exists C>0?C>0, ?m≥(C/?2)log?N\forall m \ge (C/\epsilon^2) \log N?m(C/?2)logN,如果E~Unif(Gn,m)E \sim Unif(G_{n,m})EUnif(Gn,m?),存在random projection
Q=nmPEQ = \sqrt{\frac{n}{m}}P_EQ=mn??PE?

使得下面的事件概率不小于1?2e?c?2m1-2e^{-c\epsilon^2m}1?2e?c?2m
(1??)∥x?y∥2≤∥Qx?Qy∥2≤(1+?)∥x?y∥2(1-\epsilon)\left\| x-y \right\|_2 \le\left\| Qx-Qy \right\|_2 \le (1+\epsilon)\left\| x-y \right\|_2(1??)x?y2?Qx?Qy2?(1+?)x?y2?

也就是approximate isometry成立。關于Grassman流形上的均勻分布Unif(Gn,m)Unif(G_{n,m})Unif(Gn,m?)可以參考上一講。

Random Projection

在分析J-L引理前,我們先了解一下隨機投影。

引理:隨機投影的性質
假設PPP是從Rn\mathbb{R}^nRnEEE上的投影,其中E~Unif(Gn,m)E \sim Unif(G_{n,m})EUnif(Gn,m?),則?z∈R,?>0\forall z \in \mathbb{R},\epsilon>0?zR,?>0

  • E∥Pz∥22=mn∥z∥2\sqrt{E\left\| Pz \right\|_2^2} = \sqrt{\frac{m}{n}} \left\| z\right\|_2EPz22??=nm??z2?
  • with probability at least 1?2e?c?2m1-2e^{-c\epsilon^2m}1?2e?c?2m, (1??)mn∥z∥2≤∥Pz∥2≤mn(1+?)∥z∥2(1-\epsilon)\sqrt{\frac{m}{n}} \left\| z\right\|_2 \le\left\| Pz \right\|_2 \le \sqrt{\frac{m}{n}} (1+\epsilon)\left\|z \right\|_2(1??)nm??z2?Pz2?nm??(1+?)z2?
  • 評注
    基于這個引理,要說明J-L引理是非常容易的。定義X?X={x?y:x,y∈X}\mathcal{X}-\mathcal{X} = \{x-y:x,y \in \mathcal{X}\}X?X={x?y:x,yX}

    ?z∈X?X\forall z \in \mathcal{X}-\mathcal{X}?zX?X,with probability at least 1?2e?c?2m1-2e^{-c\epsilon^2m}1?2e?c?2m, (1??)mn∥z∥2≤∥Pz∥2≤mn(1+?)∥z∥2(1-\epsilon)\sqrt{\frac{m}{n}} \left\| z\right\|_2 \le\left\| Pz \right\|_2 \le \sqrt{\frac{m}{n}} (1+\epsilon)\left\|z \right\|_2 (1??)nm??z2?Pz2?nm??(1+?)z2?

    定義Q=nmPQ=\sqrt{\frac{n}{m}}PQ=mn??P,則
    (1??)∥z∥2≤∥Qz∥2≤(1+?)∥z∥2(1-\epsilon) \left\| z\right\|_2 \le\left\| Qz \right\|_2 \le (1+\epsilon)\left\|z \right\|_2 (1??)z2?Qz2?(1+?)z2?

    要對所有的zzz都成立,則對應的概率至少為
    1?2∣X?X∣e?c?2m≥1?2N2e?c?2m=1?2eln?N2?c?2m1-2|\mathcal{X}-\mathcal{X}|e^{-c\epsilon^2m} \ge 1-2N^2e^{-c\epsilon^2m} = 1-2e^{\ln N^2-c\epsilon^2m}1?2X?Xe?c?2m1?2N2e?c?2m=1?2elnN2?c?2m

    如果m≥(C/?2)log?Nm \ge (C/\epsilon^2) \log Nm(C/?2)logN,則
    1?2eln?N2?c?2m≥1?2e(2/C?c)?2m1-2e^{\ln N^2-c\epsilon^2m} \ge 1-2e^{(2/C-c)\epsilon^2m}1?2elnN2?c?2m1?2e(2/C?c)?2m

    換一個常數就是J-L的形式了。

    證明
    不妨設∥z∥2=1\left\|z \right\|_2=1z2?=1,我們要討論的是zzz為確定的向量,PPP是一個隨機投影(with Haar measure),第一條性質要解決的是期望,它等價于把zzz當作Sn?1S^{n-1}Sn?1上的均勻分布,把PPP當成一個確定的投影,甚至為了簡單起見,假設PPP就是一個coordinate map,也就是除了前mmm個坐標外,其他坐標都是0,則E∥Pz∥22=E∑i=1mZi2=mnE \left\| Pz \right\|_2^2 = E \sum_{i=1}^m Z_i^2 = \frac{m}{n}EPz22?=Ei=1m?Zi2?=nm?

    定義f(x)=∥Px∥2f(x) = \left\|Px\right\|_2f(x)=Px2?,這是一個Lipschitz范數為1的Lipschitz函數,于是
    ∣f(x)?f(y)∣∥x?y∥2=∣∥Px∥2?∥Py∥2∣∥x?y∥2≤∥P(x?y)∥2∥x?y∥2≤1\frac{|f(x)-f(y)|}{\left\| x-y\right\|_2} = \frac{|\left\|Px\right\|_2-\left\|Py\right\|_2|}{\left\| x-y\right\|_2} \le \frac{\left\| P(x-y) \right\|_2}{\left\| x-y\right\|_2} \le 1x?y2?f(x)?f(y)?=x?y2?Px2??Py2??x?y2?P(x?y)2??1

    因為球面分布的Lipschitz函數是亞高斯的,于是
    P(∣∥PX∥2?E∥PX∥2∣≥t)≤2e?cnt2P(|\left\|PX\right\|_2-E\left\|PX\right\|_2| \ge t) \le 2e^{-cnt^2}P(PX2??EPX2?t)2e?cnt2

    這里指數上有個nnn是因為這個分布是Sn?1S^{n-1}Sn?1,相比nSn?1\sqrt{n}S^{n-1}n?Sn?1少了一個scalar,所以在指數上添一個(n)2(\sqrt{n})^2(n?)2,另外就是在證明這個結果的時候我們用的是f(X)?Mf(X)-Mf(X)?M是亞高斯的,然后根據centering技巧得到f(X)?Ef(X)f(X)-Ef(X)f(X)?Ef(X),這里可以用另一個centering技巧,即f(X)?Ef(X)2f(X)-\sqrt{Ef(X)^2}f(X)?Ef(X)2?也是亞高斯的(事實上可以用任意Lp范數),于是
    P(∣∥PX∥2?E∥PX∥22∣≥t)≤2e?cnt2P(|\left\|PX\right\|_2-\sqrt{E\left\|PX\right\|_2^2}| \ge t) \le 2e^{-cnt^2}P(PX2??EPX22??t)2e?cnt2

    t=?m/nt=\epsilon\sqrt{m/n}t=?m/n?,引理得證。

    總結

    以上是生活随笔為你收集整理的UA MATH567 高维统计IV Lipschitz组合8 随机投影与John-Lindenstrauss引理的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 国产伦理吴梦梦伦理 | 成人综合区 | 午夜精品久久久久久久99 | 久久接色 | 成人午夜免费在线 | www.777奇米 | 久久久久成人网站 | 性欧美video另类hd尤物 | 91视频黄| 成人欧美一区二区三区黑人 | 美女扒开大腿让男人桶 | 欧美日韩免费在线视频 | 热久久免费| 福利社午夜影院 | 国产欧美精品在线 | 波多野结衣 久久 | 伊人导航 | 日本熟妇乱子伦xxxx | 久久精品国产亚洲av香蕉 | 久久99精品久久久久久国产越南 | 免费观看成年人网站 | 外国av网站 | 国产911| 激情内射亚洲一区二区三区爱妻 | 欧美精品高清 | 亚洲精品无码一区二区 | 超碰.com | 一本一道久久a久久 | 中文字幕亚洲高清 | 五月婷婷丁香激情 | 三年在线观看视频 | 亚洲aⅴ网站 | 日本激情视频一区二区三区 | 亚洲国产日韩欧美一区二区三区 | 欧美色视频一区二区三区 | 欧美第一页| 黄色在线免费观看网站 | 26uuu国产| 亚洲精品一区二区三 | 一区二区av在线 | 你懂的日韩 | 黄色免费在线网址 | 成人观看| 亚洲成人免费观看 | 桃色视频在线 | 久久嫩 | 欧美动态视频 | 视频在线一区 | 日本a在线免费观看 | 91精品国产综合久久久蜜臀粉嫩 | 91看片淫黄大片91桃色 | 九九热在线播放 | 欧美做爰啪啪xxxⅹ性 | 黑人性生活视频 | 99国产在线观看 | 国产精品久久久久无码av | 欧美一区二区在线观看 | 欧美日韩图片 | 日日摸天天爽天天爽视频 | 69色 | 中文字幕在线看 | 国产精品一区二区av | 深夜福利日韩 | 欧美自拍视频在线观看 | 欧美 日韩 精品 | 亚洲无吗在线观看 | 在线能看的av网站 | 尤物视频一区 | 男女做激情爱呻吟口述全过程 | 一区二区三区福利视频 | 国产精品爽| 双腿张开被9个男人调教 | 全黄一级裸体 | 插插宗合网| 香蕉视频网站 | 凹凸精品一区二区三区 | 操女人逼逼视频 | 免费国产a | 亚州男人天堂 | 美女的奶胸大爽爽大片 | 欧美成人aa | 瑟瑟网站免费 | 天天色综合图片 | 91精品国产综合久久福利软件 | 欧美xxxx×黑人性爽 | 日本网站在线看 | 18禁男女爽爽爽午夜网站免费 | 悠悠色综合| 国产亚洲精品码 | 亚洲无人区码一码二码三码 | 国产精品国产三级国产专区51 | 日狠狠| 国产黄色的视频 | 美足av | 欧美国产不卡 | 精品国产视频一区二区 | 中国黄色一级大片 | 五月婷婷丁香六月 | 亚洲精品第二页 |