CCCF“CNCC2017特邀报告”丘成桐:现代几何学与计算机科学
ref:https://www.yangfenzi.com/kexue/40294.html
by 月光 · 2017 年 12 月 22 日
丘成桐教授是當代最著名的數(shù)學家之一,他在中國計算機大會的特邀報告講的是幾何學對計算機科學(包括人工智能)的貢獻,計算機領(lǐng)域的學者可從中受到啟發(fā)。也許人們沒有想過幾何學對計算機科學的影響會如此之大,如果要更上一層樓,應該學習更高深的數(shù)學知識。
來源:《中國計算機學會通訊》2017年第12期《CNCC2017特邀報告》
由劉利剛根據(jù)CNCC 2017特邀報告整理而成)
我很榮幸受邀來到中國計算機大會上演講。我本人主要從事微分幾何等基礎(chǔ)數(shù)學領(lǐng)域的研究。但最近十多年來,因為我的學生,美國石溪大學顧險峰教授及其他朋友的緣故,我進行了一些與計算機科學有關(guān)的研究。通過研究我發(fā)現(xiàn),純數(shù)學尤其是幾何學在計算機科學中大有作為。
現(xiàn)代幾何的歷史及幾何學重要概念
現(xiàn)代幾何的歷史
在歷史上,幾何學是數(shù)學的開始。古希臘數(shù)學家歐幾里得(Ευκλειδη?)1(公元前330~前275年)將平面幾何的所有定理組合,發(fā)現(xiàn)這些定理都可以由五個公理推導出來,這是人類理性科學文明的重要里程碑之一。所以我也鼓勵大家把這個方法運用到人工智能上——從復雜多樣的網(wǎng)絡(luò)中找到其最簡單的公理。如果能夠?qū)崿F(xiàn),將會是人工智能的里程碑!
當時希臘人的數(shù)學工具不夠,除了二次方程定義的圖形(直線、圓、平面、球等),沒有能力處理更一般的圖形。直到古希臘哲學家、數(shù)學家、物理學家阿基米德(Archimedes)2(公元前287~前212年)開始利用簡單的微積分的無限算法計算體積,并開始發(fā)展射影幾何理論。微積分的出現(xiàn)使得幾何學進入了新紀元,微分幾何由此誕生。幾何學在瑞士數(shù)學家歐拉(Leonhard Euler)(公元1707~1783年)和德國數(shù)學家高斯(C.F.Gauss)(公元1777~1855年)手上突飛猛進,變分方法和組合方法被大量引用來描述幾何現(xiàn)象和物理現(xiàn)象。更多丘成桐分享:www.yangfenzi.com/tag/shing-tung-yau
現(xiàn)代幾何起源于德國數(shù)學家黎曼(Riemann)(公元1826~1866年)在1854年的博士論文,論文中首次將幾何空間看成一個抽象而自足的空間,同時可以研究曲率和有關(guān)的幾何問題。后來這個空間成為現(xiàn)代物理的基礎(chǔ),現(xiàn)在物理學中研究的引力波就是從這個空間開始的。沒有這個空間,愛因斯坦(Albert Einstein)就不可能研究出廣義相對論。黎曼的論文中認為離散空間也是一個重要的空間,它包含了我們現(xiàn)在研究的圖論,或許可以用來研究宇宙萬物可能產(chǎn)生的一切。因此,黎曼的這篇論文為現(xiàn)代幾何奠定了基礎(chǔ),他的思想在現(xiàn)代幾何學中具有不可替代的作用。150年后,我們還是看得到他的智慧。
對稱
幾何學能夠提供很多重要的想法,其影響無所不在。其中一個重要的概念是“對稱”。我們中國人講的“陰陽”就是一個對稱的例子。數(shù)學上有一個叫龐加萊對偶的概念,其實也是陰陽,但比陰陽更加具體。19世紀挪威數(shù)學家索菲斯·李(Sophus Lie)發(fā)展的李群,是物理學中的一個重要工具。現(xiàn)代物理中幾乎沒有一個學科可以離開李群。在幾何學上,德國數(shù)學家克萊因(Klein)于1870年發(fā)表的《埃爾朗根綱領(lǐng)》中提出了用對稱來統(tǒng)治幾何的重要原理。隨后,產(chǎn)生了許多重要的幾何學分支,例如仿射幾何、保角幾何和投影幾何等。這些幾何都與圖像處理有著密切的聯(lián)系,近十多年來我們都是用保角幾何等來處理各種圖像問題。所以,當年被認為不重要的幾何學,現(xiàn)在卻有重要的實際用處。從大范圍對稱到小范圍對稱,都對20世紀的基礎(chǔ)研究產(chǎn)生了重要的影響。
平行移動
另一個很重要的概念是平行移動。通俗地講,平行移動就是空間中的一點與另外一點之間的一個比較的方法。這個概念在物理學和工程中已有廣泛的應用,但至今還沒有被引進到計算機科學中來。這是一個在數(shù)學中很重要、很廣泛的概念,它影響了整個數(shù)學界兩千年。所以,我期望平行移動能夠在計算機科學中大放異彩。
幾何學與計算機科學的相互影響
幾何對于計算機科學的影響
現(xiàn)代幾何為計算機科學奠定了理論基礎(chǔ),并且指導計算機科學未來的發(fā)展方向。
- 現(xiàn)代幾何廣泛應用于計算機科學幾乎所有的分支,例如計算機圖形學、計算機視覺和計算機輔助幾何設(shè)計、計算機網(wǎng)絡(luò)、數(shù)字幾何處理、數(shù)字安全和醫(yī)學圖像等;
- 黎曼幾何有助于理解社交網(wǎng)絡(luò);
- 現(xiàn)代幾何理論有望用來理解人工智能的黑箱,例如深度學習、生成對抗網(wǎng)絡(luò)和機器定理證明等;
- 所有與圖像或者網(wǎng)絡(luò)有關(guān)的問題都是幾何問題的一部分。
計算機科學對于幾何的影響
計算機科學的發(fā)展為現(xiàn)代幾何提供了需求和挑戰(zhàn),并推動了跨學科的發(fā)展。例如:
- 人工智能中的機械定理證明推動了計算代數(shù)的發(fā)展;
- 數(shù)據(jù)安全、比特幣和區(qū)塊鏈的發(fā)展推動了代數(shù)數(shù)論、橢圓曲線和模型式的發(fā)展;
- 社交網(wǎng)絡(luò)和大數(shù)據(jù)的發(fā)展,催生了持續(xù)同調(diào)理論的發(fā)展;
- 動漫和游戲的發(fā)展推動了計算共形幾何學科的誕生和發(fā)展;
- 機器學習的發(fā)展推動了最優(yōu)傳輸理論的發(fā)展。
幾何學在計算機科學的應用案例
圖論
圖論在計算機科學中的重要性是根本的。圖由頂點和邊組成,允許重邊和過單頂點的圈。我們通過研究定義在頂點和邊上的函數(shù),就可以研究圖的組合問題。例如,如何將原圖分解成很多簡單的子圖,如何衡量各個分支間的連接度,如何將圖染色等,這些問題都與圖上的特征函數(shù)緊密相連。
事實上,圖上的特征函數(shù)與光滑流形上的特征函數(shù)具有很多相似的地方。我們將四十年前我和鄭紹遠3、李偉光?所做的關(guān)于黎曼流形的特征函數(shù)的工作推廣到圖上,得到了很好的結(jié)果。圖上的拉普拉斯算子自然定義了圖上的取平均的操作,其特征根及其特征函數(shù)與圖的組合函數(shù)密切相關(guān)。我們研究了圖上的熱擴散過程,發(fā)現(xiàn)運用李-丘估計能夠控制熱核。通過研究圖上的薛定諤方程,定義了圖上的量子隧道概念。這些概念都是從物理上來的,被借用到圖上。我們將流形的拓撲結(jié)構(gòu)推廣到有向圖上,定義了圖上的同調(diào)群。同調(diào)群可以用來研究圖上密切的關(guān)系和它的內(nèi)容。
進化圖論為表達種群結(jié)構(gòu)提供了數(shù)學工具:頂點代表個體,邊代表個體的交互作用。圖可以用來代表各種具有空間結(jié)構(gòu)的種群,例如細菌、動植物、組織結(jié)構(gòu)、多細胞器官和社交網(wǎng)絡(luò)。在進化過程中,每個個體依據(jù)自身的適應程度進行繁殖并侵占到鄰近頂點。圖的拓撲反映了基因的演化——變異和選擇的平衡。特別地,互聯(lián)網(wǎng)是一個非常復雜的網(wǎng)絡(luò)。社交行為的進化可以用進化博弈論來研究。個體和鄰居博弈,根據(jù)收益而繁殖。個體繁殖速率受到自身與其他個體的交互作用影響,從而產(chǎn)生進化博弈的動態(tài)演化。其核心問題在于,對于給定的圖,如何決定哪種策略會取得成功。
2017年初,我們在Nature上發(fā)表了一篇文章?,得到了在任何給定的圖上進行弱選擇,自然選擇從兩種彼此競爭的策略中如何進行挑選的一個條件。這個理論框架適用于人類決策,也適用于任何集群組織的生態(tài)演化。我們從弱選擇極限得到的結(jié)果,解釋了何種組織結(jié)構(gòu)導致何種行為。我們發(fā)現(xiàn),如果存在成對的強紐帶結(jié)構(gòu),合作就會大規(guī)模出現(xiàn)。我們用數(shù)學證明了社會學方面的一個結(jié)論:穩(wěn)定的伙伴或者伴侶,對于形成合作型的社會起到了骨干作用。
計算機圖形學:全局參數(shù)化
“基于共形幾何的全局參數(shù)化”是我們研究了近20年的一個方向,自1999年顧險峰在哈佛大學讀博士時就已經(jīng)開始做這方面的工作了。曲面參數(shù)化問題就是如何將曲面整體光滑映射到二維參數(shù)區(qū)域,使得幾何畸變最小。曲面參數(shù)化是紋理貼圖和法向貼圖等技術(shù)的基礎(chǔ)。共形幾何是從古典的黎曼幾何中產(chǎn)生的一個很重要的幾何分支。
我們將大衛(wèi)雕像模型(如圖1(a))共形(保角)地映射到平面上(如圖1(b)),看上去似乎變化很大,其實不然,因為這是保持角度不變的。如果我們在參數(shù)區(qū)域平面上畫好網(wǎng)格點,然后將這些網(wǎng)格點映射到人臉上,就能在人臉上顯示出很漂亮的網(wǎng)格圖形(如圖1(c))。共形映射在工程中應用很廣,因為它能將圖上的無窮小圓仍然映射成無窮小圓,從而不會導致太大的變化。
圖1 曲面的共形映射
上述應用中需要數(shù)學上一個很重要的定理,即龐加萊單值化定理。該定理是說映射的幾何圖形只與它的拓撲性有關(guān),任何幾何本質(zhì)上可以歸結(jié)為三種幾何,即球面幾何、歐氏幾何、雙曲幾何。這樣,我們就可以將很多很重要但又很復雜的幾何用很簡單的方式描述出來。
但保角映射也有其不足,所以我們發(fā)展了第二類映射——保面元映射。保面元映射能使面元的面積被保持,但角度不一定被保持。如圖2所示,保角映射有可能將一個面拉得很遠(如圖2(b)),而保面元映射(如圖2(c))則不會產(chǎn)生這種情況。根據(jù)凸幾何中的閔可夫斯基定理和亞歷山大定理,保面元映射可以通過求解蒙日-安培方程得到。
圖2 曲面的保角映射和保面元映射
計算機視覺:動態(tài)曲面追蹤
計算機視覺中一個很重要的問題是動態(tài)曲面追蹤(如圖3),即給定一系列動態(tài)三維曲面,如何自動找到曲面間的光滑映射,使得特征點匹配,映射帶來的幾何畸變最小。共形映射也可以用來求解動態(tài)曲面追蹤,并且應用到表情識別和追蹤中,可以從一個人的各種面部表情得到他的重要面部特征。主要方法是用共形映射或保面元映射將它們映射到平面上,然后用擬共形映射來尋找最佳微分同胚。擬共形映射是一個很重要的數(shù)學工具,它在計算機數(shù)學上具有廣泛應用。至今,數(shù)學家們?nèi)栽谘芯繑M共形映射及其性質(zhì)。它不是一個正則方程,而是一個偽正則方程,即Beltrami方程。在研究圖形圖像變形時這個方程非常重要,我們可以在微分同胚空間中進行變分,得到最優(yōu)的映射。該方法在醫(yī)療和動漫中都有很重要的應用。
圖3 動態(tài)曲面追蹤
計算力學:六面體網(wǎng)格生成
在計算力學中會經(jīng)常用到六面體網(wǎng)格來進行有限元分析。我們也可以使用共形映射生成一個網(wǎng)格曲面的規(guī)則六面體網(wǎng)格,并且具有盡量少的奇異點和奇異線。圖4是在一只兔子模型內(nèi)部生成了比較好的六面體網(wǎng)格。根據(jù)拓撲學理論,生成六面體網(wǎng)格時通常會產(chǎn)生一些奇異點。基于葉狀結(jié)構(gòu)理論,我們對這些奇異點進行分類,并進行了一些深入的研究,從而得出了一些在計算機科學上有意義的結(jié)論。
圖4 兔子曲面的六面體網(wǎng)格生成
數(shù)字幾何處理:幾何壓縮
數(shù)字幾何處理中一個很重要的問題是幾何壓縮。在進行幾何壓縮時需要用到蒙日-安培理論和幾何逼近理論。如何壓縮復雜幾何數(shù)據(jù),保證幾何誤差最小,并同時保證黎曼度量、曲率測度和微分算子的收斂性,這就是幾何壓縮問題。我們采取的解決方法是用共形映射將曲面映射到平面,再用蒙日-安培理論,將高曲率區(qū)域放大,然后重新采樣,并在共形參數(shù)域上進行Delaunay三角剖分。這樣得到的簡化多面體網(wǎng)格就能夠保證黎曼度量、曲率測度和微分算子收斂。采用不同的幾何壓縮方法將圖5(a)所示的三角網(wǎng)格壓縮到4000個頂點所得的結(jié)果如圖5(b)和圖5(c)所示。
圖5 不同的幾何壓縮方法對比
人工智能
機器學習算法需要大量的有標注的樣本數(shù)據(jù)。對于圖像分類,經(jīng)常需要使用上千萬張有標注的圖像來進行訓練。對于語音識別,需要成千上萬小時有標注的語音數(shù)據(jù)。對于機器翻譯,通常是在千萬量級的雙語語對上進行訓練。但是很多領(lǐng)域卻無法收集大數(shù)據(jù),一是因為實例過少,例如醫(yī)療方面的疑難雜癥;二是由于過于抽象,例如幾何研究中的高維流形等。
機器學習算法中的深度神經(jīng)網(wǎng)絡(luò)需要數(shù)十億個參數(shù),需要昂貴的硬件支持和漫長的計算時間,訓練難度很大。機器學習算法等價于能量優(yōu)化。由于規(guī)模龐大,無法用二階優(yōu)化,因而一般是用隨機梯度下降法。由于深度神經(jīng)網(wǎng)絡(luò)層數(shù)過深,經(jīng)常出現(xiàn)梯度消失和梯度爆炸的問題,因此訓練過程收斂困難。
目前,以神經(jīng)網(wǎng)絡(luò)為代表的統(tǒng)計機器學習在工程實踐中取得了成功,但是其理論基礎(chǔ)非常薄弱,被人們稱為黑箱算法。人工智能算法的不可解釋性,極大地阻礙了這一領(lǐng)域的進一步應用和發(fā)展。深度學習理論的建立,應該是目前最為迫切的問題。更多人工智能AI解讀:www.yangfenzi.com/tag/rengongzhineng
人類的智能主要包括歸納總結(jié)和邏輯演繹,對應著人工智能中的聯(lián)結(jié)主義(如人工神經(jīng)網(wǎng)絡(luò))和符號主義(如Groebner Basis方法)。人類對大量的視覺聽覺信號的感知處理都是下意識的,是基于大腦皮層神經(jīng)網(wǎng)絡(luò)的學習方法;大量的數(shù)學推導和定理證明是有強烈主觀意識的,是基于公理系統(tǒng)的符號演算方法。
雖然人工智能的算法原理目前沒有被透徹理解,但我們相信其內(nèi)在原理可以用現(xiàn)代幾何原理來解釋。例如,對于機器定理的證明,我們運用了希爾伯特定理;對于生成對抗網(wǎng)絡(luò),我們運用了亞歷山大定理和蒙日-安培方程。
人工智能中,符號主義的一個代表就是機器定理證明。目前基于符號計算的機器定理證明的理論根基是希爾伯特定理:多元多項式環(huán)中的理想都是有限生成的。首先,我們將一個幾何命題的條件轉(zhuǎn)換成代數(shù)多項式,同時把結(jié)論也轉(zhuǎn)換成多項式,然后證明條件多項式生成的根理想包含結(jié)論對應的多項式,即將定理證明轉(zhuǎn)化為根理想成員判定問題。一般而言,多項式理想的基底并不唯一,Groebner基方法可以生成滿足特定條件的理想基底,因此可以自動判定理想成員問題。從計算角度而言,Groebner基方法所要解決的問題的本質(zhì)復雜度都是超指數(shù)級別的,所以即便對于簡單的幾何命題,其機器證明過程都可能引發(fā)儲存空間的指數(shù)爆炸,這揭示了機器定理證明的本質(zhì)難度。到目前為止,機器定理證明方法還沒有發(fā)現(xiàn)深刻的定理。
生成對抗網(wǎng)絡(luò)是聯(lián)結(jié)主義的一個例子。生成對抗網(wǎng)絡(luò)其實就是以己之矛克己之盾,在矛盾中發(fā)展,使得矛更加鋒利,盾更加強韌。這里的盾被稱為判別器,矛被稱為生成器。通常生成器G將一個隨機變量(例如高斯分布或者均勻分布),通過參數(shù)化的概率生成模型(通常是用一個深度神經(jīng)網(wǎng)進行參數(shù)化)進行概率分布的逆變換采樣,從而得到一個生成的概率分布。判別器D通常也采用深度卷積神經(jīng)網(wǎng)絡(luò)。例如,給定兩個概率分布μ和v,其中μ是隨機白噪聲,v是人臉相片的概率分布。這樣,生成對抗網(wǎng)絡(luò)問題就是在兩個概率分布μ和v之間找到一個最優(yōu)傳輸映射(見圖6)。我們可以通過對蒙日-安培方程進行求解來找到最優(yōu)傳輸映射,從而節(jié)省很多生成對抗的時間。蒙日-安培方程本身就等價于微分幾何中的亞歷山大定理。
圖6 生成模型
生成對抗網(wǎng)絡(luò)實質(zhì)上是用深度神經(jīng)網(wǎng)絡(luò)來計算概率測度之間的變換。雖然規(guī)模宏大,但是數(shù)學本質(zhì)并不復雜。應用相對成熟的最優(yōu)傳輸理論和蒙日-安培理論,我們可以為機器學習的黑箱給出透明的幾何解釋,這有助于設(shè)計出更為高效和可靠的計算方法。
總結(jié)與展望
現(xiàn)代數(shù)學和計算機科學的發(fā)展緊密相關(guān)。共形幾何的單值化定理、蒙日-安培理論、最優(yōu)傳輸理論、凸幾何的Minkowski-Alexandrov理論等現(xiàn)代幾何中的深刻定理,已經(jīng)應用到計算機科學的許多領(lǐng)域。特別地,數(shù)字金融中的區(qū)塊鏈技術(shù)依賴于數(shù)論的現(xiàn)代成果,人工智能的理論解釋依賴于現(xiàn)代代數(shù)中的希爾伯特理論等。
希望我們能夠?qū)⒏嗟臄?shù)學理論應用到計算機科學中,不僅能有效地提出各種計算機算法,而且能給出理論的基礎(chǔ)。人工智能需要一個堅實的理論基礎(chǔ),否則它的發(fā)展會有很大困難。我們期待計算機科學與現(xiàn)代幾何能有更為深刻和密切的結(jié)合,更多的跨學科領(lǐng)域被創(chuàng)立、成長和壯大。我們相信人工智能的理論基礎(chǔ),深度學習的幾何解釋和數(shù)字金融的理論近期會得到蓬勃發(fā)展!
整理者:劉利剛,CCF專業(yè)會員、杰出演講者,CCF計算機輔助設(shè)計與圖形學專委會常委。中國科學技術(shù)大學數(shù)學科學學院計算與應用數(shù)學系主任、教授。主要研究方向為計算機圖形學與計算幾何。
腳注
1. 歐幾里得(希臘文:Ευκλειδη?,公元前330年~前275年),也被稱為亞歷山大里亞的歐幾里得,以便區(qū)別于墨伽拉的歐幾里得。古希臘數(shù)學家,被稱為“幾何學之父”。他活躍于托勒密一世(公元前323年~前283年)時期的亞歷山大里亞,也是亞歷山大學派的成員。他在著作《幾何原本》中提出五大公設(shè),成為歐洲數(shù)學的基礎(chǔ)。歐幾里得也寫過一些關(guān)于透視、圓錐曲線、球面幾何學及數(shù)論的作品。歐幾里得幾何被廣泛認為是數(shù)學領(lǐng)域的經(jīng)典之作。
2. 阿基米德(Archimedes,公元前287年~前212年),古希臘哲學家、數(shù)學家、物理學家、力學家,靜態(tài)力學和流體靜力學的奠基人,享有“力學之父”的美稱。阿基米德和高斯、牛頓并列為世界三大數(shù)學家。“給我一個支點,我就能撬起整個地球”是他的名言。
3. 鄭紹遠,1970年畢業(yè)于香港中文大學聯(lián)合書院數(shù)學系,師從國際著名數(shù)學家陳省身先生,在美國加州大學伯克利分校獲得博士學位。后在普林斯頓大學、紐約州立大學石溪分校、加州大學洛杉磯分校等任教,之后在香港中文大學、香港科技大學數(shù)學系任系主任。他的卓越貢獻是黎曼流形上的Laplacian特征值的比較定理。他與丘成桐教授合作解決了高級Minkowski問題,對Monge-Ampere方程、黎曼流形的特征值估計等方面作出了突出貢獻。
4. 李偉光(Peter Li),美國加州大學爾灣分校數(shù)學系華裔教授,美國藝術(shù)和科學院院士。1982年丘成桐與李偉光合著的論文,給出了線性熱方程的逐點微分不等式,在沿曲線積分后可以給出經(jīng)典的Harnack不等式。被稱為“李-丘”的工作所得到的Harnack不等式也是漢米爾頓(Hamilton)開創(chuàng)早先解決方案進行分析的基礎(chǔ)。李偉光19歲赴美國求學,先后獲得加州大學弗雷斯諾分校數(shù)學學士,加州大學伯克利分校數(shù)學碩士和博士學位。
5. Allen B, Lippner G, Chen Y T, et al. Evolutionary dynamics on any population structure[J]. Nature, 2017, 544(7649):227.
總結(jié)
以上是生活随笔為你收集整理的CCCF“CNCC2017特邀报告”丘成桐:现代几何学与计算机科学的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 苹果开发者账号申请
- 下一篇: ie9 ajax 二进制流,2.ajax