脑皮质算法(2)一种基于新皮层网格细胞的智能和皮质功能的框架
A Framework for Intelligence and Cortical Function Based on Grid Cells in the Neocortex
摘要
新皮層是如何工作的還是個謎。在這篇論文中,我們提出了一個新的框架來理解它的功能。網(wǎng)格細胞是內(nèi)嗅皮層中的神經(jīng)元,代表動物在其環(huán)境中的位置。最近的證據(jù)表明網(wǎng)格細胞樣神經(jīng)元可能也存在于新皮層中。我們認為網(wǎng)格細胞存在于整個新皮層,在每一個區(qū)域和每一個皮層柱中。他們?yōu)榇竽X皮層如何運作定義了一個基于位置的框架。盡管內(nèi)嗅皮層中的網(wǎng)格細胞代表了一件事物的位置,即身體相對于它所處的環(huán)境的位置,我們認為皮質(zhì)網(wǎng)格細胞同時代表了許多事物的位置。體感皮層的皮層柱跟蹤觸覺特征相對于被觸摸物體的位置,視覺皮層的皮層柱跟蹤視覺特征相對于被觀察物體的位置。我們提出,內(nèi)嗅皮層和海馬體中用來學習環(huán)境結(jié)構(gòu)的機制,現(xiàn)在被新皮層用來學習物體的結(jié)構(gòu)。在每個皮層列中都有位置的表示,這表明了新皮層如何表示物體的組成和物體的行為的機制。這導致了一個假設,即新皮層的每個部分學習完整的物體模型,每個物體的模型分布在整個新皮層。在所有皮質(zhì)區(qū)域觀察到的電路的相似性是一個強有力的證據(jù),證明即使是高水平的認知任務也是學習的,并在基于位置的框架中表示。
關(guān)鍵詞: 新皮層,網(wǎng)格細胞,新皮層理論,層次,物體識別,皮層柱
簡介
人類的大腦皮層會學習一個極其復雜和詳細的世界模型。我們每個人都能識別1000個物體。我們知道這些物體是如何通過視覺、觸覺和聽覺出現(xiàn)的,我們知道這些物體在我們與它們互動時的行為和變化,我們知道它們在世界上的位置。人類的新大腦皮層也學習抽象物體的模型,那些物理上不存在或我們不能直接感知的結(jié)構(gòu)。大腦皮層的回路也很復雜。了解大腦皮層的復雜回路如何學習世界的復雜模型是神經(jīng)科學的主要目標之一。
弗農(nóng)·蒙特卡斯爾(Vernon Mountcastle)是第一個提出新皮層的所有區(qū)域從根本上是相同的。他認為,一個區(qū)域與另一個區(qū)域的區(qū)別主要是由對該區(qū)域的輸入決定的,而不是由固有電路和功能的差異決定的。他進一步提出,一個小體積的皮質(zhì),一個皮質(zhì)柱,是復制的單位(Mountcastle, 1978)。
這些都是令人信服的想法,但很難確定一個列能做什么足以解釋所有的認知能力。今天,最普遍的觀點是,新皮層以一系列分層步驟處理感官輸入,提取越來越復雜的特征,直到物體被識別(福島,1980;Riesenhuber和Poggio, 1999)。盡管這一觀點解釋了感官推斷的某些方面,但它未能解釋人類行為的豐富性,我們?nèi)绾螌W習物體的多維模型,以及我們?nèi)绾瘟私猱斘覀兣c物體交互時,物體本身是如何變化和行為的。它也沒能解釋大部分新大腦皮層的回路在做什么。在本文中,我們提出了一個新的基于位置處理的理論框架,解決了這些缺點。
在過去的幾十年里,神經(jīng)科學中一些最令人興奮的進展都與“網(wǎng)格細胞”和“位置細胞”有關(guān)。這些神經(jīng)元存在于哺乳動物的海馬體復合體中,這是一組區(qū)域,對人類來說,它的大小和形狀大致相當于手指,位于大腦的兩側(cè)。網(wǎng)格細胞結(jié)合位置細胞學習世界地圖(O 'Keefe和Dostrovsky, 1971;Hafting et al., 2005;Moser et al., 2008)。網(wǎng)格單元格表示動物的當前位置相對于那些地圖。海馬體的建模工作已經(jīng)證明了這些神經(jīng)表征在情景和空間記憶方面的力量(Byrne等人,2007;Hasselmo等人,2010;Hasselmo, 2012)和導航(Erdem和Hasselmo, 2014;Bush et al., 2015)。還有證據(jù)表明網(wǎng)格細胞在更抽象的認知任務中發(fā)揮作用(Constantinescu et al., 2016;Behrens et al., 2018)。
最近的實驗證據(jù)表明網(wǎng)格細胞可能也存在于新皮層中。使用功能磁共振成像(Doeller et al., 2010;Constantinescu等,2016;Julian etal ., 2018)在新皮層的前額葉和頂葉區(qū)域發(fā)現(xiàn)了網(wǎng)格細胞樣放電模式的特征。在人類中使用單細胞記錄(Jacobs等人,2013年)在額葉皮層中發(fā)現(xiàn)了網(wǎng)格細胞的更直接證據(jù)(Long和Zhang, 2018年),使用多個四極管記錄,發(fā)現(xiàn)了在大鼠S1中顯示網(wǎng)格細胞、位置細胞和結(jié)膜細胞反應的細胞。我們的團隊提出,新皮層對感覺輸入的預測需要在整個新皮層的感覺區(qū)域中呈現(xiàn)一個以物體為中心的位置,這與網(wǎng)格細胞樣機制一致(Hawkins等人,2017)。
我們認為網(wǎng)格細胞樣神經(jīng)元存在于新皮層的每一列中。內(nèi)側(cè)內(nèi)嗅皮層(MEC)中的網(wǎng)格細胞主要代表一個物體的位置,即身體,我們認為皮質(zhì)網(wǎng)格細胞同時代表多個物體的位置。體感皮層中接受來自身體不同部位輸入的柱狀結(jié)構(gòu)表示這些輸入在被觸摸物體的外部參考框架中的位置。同樣地,視覺皮層的皮層柱從視網(wǎng)膜的不同斑塊接收輸入,代表視覺輸入在被觀察物體的外部參照系中的位置。網(wǎng)格細胞和位置細胞通過身體的運動學習環(huán)境模型,我們提出皮質(zhì)網(wǎng)格細胞結(jié)合感覺輸入通過學習物體模型
傳感器的移動。
盡管人們對MEC中網(wǎng)格細胞的感受場特性以及這些細胞如何編碼位置已經(jīng)有了很多了解(Rowland等人,2016年),但導致這些特性的潛在機制尚不清楚。實驗結(jié)果表明網(wǎng)格細胞具有獨特的膜狀和樹突狀特性(Domnisoru et al., 2013;Schmidt-Hieber et al., 2017)。有兩個主要的候選計算模型,振蕩干涉模型(O 'Keefe和Burgess, 2005;伯吉斯等人,2007;Giocomo等,2007,2011;和連續(xù)吸引子模型(Fuhs和Touretzky, 2006;Burak和Fiete, 2009)。本文提出的框架假設“皮層網(wǎng)格細胞”在MEC中表現(xiàn)出與網(wǎng)格細胞相似的生理特性,但該框架不依賴于這些特性是如何產(chǎn)生的。
在本文中,我們提到了“皮層列”。我們使用這個術(shù)語類似于Mountcastle,來表示一個小區(qū)域的新皮層,它跨越所有層次的深度和足夠的橫向范圍,以捕獲所有類型的細胞和感受野反應。在本文中,皮質(zhì)列不是一個物理上有標記的實體。這是一種方便的命名方法。我們通常認為一個柱大約是一平方毫米的皮質(zhì)區(qū)域,盡管這個大小不是關(guān)鍵,而且可能因物種和地區(qū)而不同。
網(wǎng)格單元格如何表示位置
為了理解我們的提議,我們首先回顧了內(nèi)嗅皮層中的網(wǎng)格細胞是如何被認為代表空間和位置的,如圖1所示。盡管網(wǎng)格單元功能的許多細節(jié)仍然未知,但在以下原則上存在普遍的共識。網(wǎng)格細胞是在環(huán)境中的多個位置變得活躍的神經(jīng)元,通常是在網(wǎng)格狀或平鋪的三角形晶格中。“網(wǎng)格單元模塊”是一組網(wǎng)格單元,激活時網(wǎng)格間距和方向相同,但在環(huán)境中的位置發(fā)生了變化(Stensola等人,2012年)。當動物移動時,網(wǎng)格單元模塊中的活動網(wǎng)格單元會發(fā)生變化,以反映動物的更新位置。即使動物處于黑暗中,這種變化也會發(fā)生,這告訴我們網(wǎng)格細胞是使用內(nèi)部或“傳出”的運動命令副本更新的(Hafting et al., 2005;McNaughton et al ., 2006;莫澤等人,2008年;Kropff et al., 2015)。這個過程被稱為“路徑整合”,它具有一個理想的特性,即不管移動的路徑是什么,當動物返回到相同的物理位置時,模塊中的相同網(wǎng)格單元將是活動的。
由于平鋪,單個網(wǎng)格單元模塊不能表示唯一的位置。要形成一個獨特位置的表示,需要查看多個網(wǎng)格單元模塊中的活動單元,其中每個網(wǎng)格單元模塊的瓦間距和/或相對于環(huán)境的方向不同,如圖1C、D所示。例如,如果一個網(wǎng)格單元格模塊在重復之前可以表示20個不同的位置,那么10個網(wǎng)格單元格模塊在重復之前可以表示大約2010個不同的位置(Fiete et al., 2008)。這種表示位置的方法有幾個可取的屬性:
(1)表現(xiàn)能力大:
一組網(wǎng)格單元格模塊可以表示的位置數(shù)量很大,因為它隨模塊的數(shù)量呈指數(shù)增長。
(2)路徑集成可以在任何位置工作:
無論網(wǎng)絡從什么位置開始,路徑集成都可以工作。這是泛化的一種形式。對于每個網(wǎng)格單元模塊,必須學習一次路徑集成屬性,然后應用到所有位置,甚至是動物從未去過的地方。
(3)每個環(huán)境的位置都是獨特的:
每一個學習環(huán)境都與一組獨特的位置相關(guān)聯(lián)。實驗記錄表明,在進入一個學習過的環(huán)境后,內(nèi)嗅網(wǎng)格細胞模塊以不同的方式“錨定”(Rowland and Moser, 2014;Marozzi等人,2015)。(術(shù)語“錨”指的是選擇每個模塊中的哪些網(wǎng)格單元格應該在當前位置激活。)這表明,動物在該環(huán)境中的當前位置和所有可以移動到的位置,具有高度確定性,具有該環(huán)境特有的表征(Fiete et al., 2008;Sreenivasan和Fiete, 2011)。
結(jié)合這些屬性,我們現(xiàn)在可以大致描述網(wǎng)格單元格如何表示一個環(huán)境,如房間,如圖2A所示。環(huán)境由一組通過路徑集成相互關(guān)聯(lián)的位置表示組成(也就是說,動物可以在這些位置表示之間移動)。集合中的每個位置表示對該環(huán)境都是惟一的,不會出現(xiàn)在任何其他環(huán)境中。一個環(huán)境包括動物可以在其中移動的所有位置,包括沒有被訪問過,但可以訪問的位置。與一些位置表示相關(guān)聯(lián)的是可觀察的地標。
新皮層中的網(wǎng)格細胞
現(xiàn)在讓我們考慮一個接收來自指尖輸入的新皮層的補丁,如圖2B所示。我們的推測是,在那片皮層中的一些神經(jīng)元代表了指尖在探索物體時的位置。當手指移動時,這些皮層網(wǎng)格細胞通過運動傳出復制和路徑集成更新其位置表示。物體,如咖啡杯,有一組相關(guān)的位置,就像環(huán)境,如房間,有一組相關(guān)的位置一樣。與一些物體的位置相關(guān)聯(lián)的是可觀察到的特征。接收來自指尖輸入的皮層區(qū)域在物體的位置空間中跟蹤來自指尖的感覺輸入的位置。通過運動和感覺,指尖皮質(zhì)區(qū)學習物體的模型,就像網(wǎng)格細胞和位置細胞學習環(huán)境的模型一樣。內(nèi)嗅皮層跟蹤身體的位置,而新皮層的不同區(qū)域獨立地跟蹤每個可移動感覺斑塊的位置。例如,體感皮層的每個區(qū)域都追蹤來自其相關(guān)身體部位的感覺輸入的位置。這些區(qū)域并行運行,構(gòu)建對象的并行模型。同樣的基本方法也適用于視覺。視網(wǎng)膜的斑塊類似于皮膚的斑塊。視網(wǎng)膜的不同部位觀察物體的不同位置。每一塊接受視覺輸入的皮層都會在被觀察物體的位置空間中跟蹤其視覺輸入的位置。當眼睛移動時,視覺皮層列感知物體上的不同位置,并學習被觀察物體的平行模型。
我們現(xiàn)在已經(jīng)討論了我們建議的最基本方面:
(1)每個皮層柱都有執(zhí)行類似網(wǎng)格細胞功能的神經(jīng)元。這些皮層網(wǎng)格細胞的激活模式代表了柱輸入相對于外部參考框架的位置。位置表示通過電機傳出復制和路徑集成進行更新。
(2)皮層列學習世界中物體的模型,類似于網(wǎng)格細胞和位置細胞學習環(huán)境的模型。通過皮層列學習的模型由一組對每個對象都是獨特的位置表示組成,其中一些位置具有可觀察到的特征。
一個基于位置的皮質(zhì)計算框架
我們的提議表明,皮層列比之前假設的更強大。通過將輸入與網(wǎng)格單元格派生的位置表示配對,單個列可以學習世界上復雜的結(jié)構(gòu)模型(另見Lewis等人,2018)。在這一節(jié)中,我們將展示基于位置的框架如何讓神經(jīng)元學習我們所知道的新皮層能夠做的豐富模型。
組合性對象
對象是由以特定方式排列的其他對象組成的。例如,通過記憶咖啡杯上每個位置的感覺來學習咖啡杯的形態(tài)是低效的。學習杯子的效率要高得多,因為它是以前學習過的物體的組成,如圓柱體和把手。考慮一個帶有標志的咖啡杯,如圖3A所示。商標存在于世界上的多個地方,它本身就是一個學習的“對象”。為了用標識來表示杯子,我們需要一種方法將一個對象(“標識”)與另一個對象(“杯子”)在相對位置關(guān)聯(lián)起來。成分結(jié)構(gòu)存在于世界上幾乎所有的物體中,因此皮質(zhì)列必須具有一種神經(jīng)機制,將新物體表示為先前學習過的物體的排列。如何實現(xiàn)這種功能?
我們提出,每個對象都與一組位置相關(guān)聯(lián),這些位置對對象來說是唯一的,并圍繞對象組成一個空間。如果手指觸碰帶有標識的咖啡杯,那么代表手指位置的皮層網(wǎng)格細胞可以在某一刻代表手指在咖啡杯空間中的位置,在重新錨定后的另一刻代表手指在標識空間中的位置。如果標識附加到杯子上,那么在標識空間中的任何點和杯子空間中的等效點之間存在固定的、一對一的關(guān)系,如圖3B所示。可以通過創(chuàng)建一個“位移”向量來實現(xiàn)在杯子上表示標識的任務,該向量將杯子空間中的任何點轉(zhuǎn)換為標識空間中的等效點。
確定兩個物體之間的位移類似于之前研究過的導航問題,具體來說,就是動物如何知道如何在環(huán)境中從a點到達b點,圖3C。解決導航問題(確定同一空間中兩點之間的位移)的機制也可以解決對象組合問題(確定兩個不同空間中兩點之間的位移)。
位移細胞
已經(jīng)提出了幾種使用網(wǎng)格單元解決點到點導航問題的解決方案。一類解決方案檢測跨多個網(wǎng)格單元模塊的兩組活動網(wǎng)格單元之間的差異(Bush等人,2015年),另一類解決方案使用線性向前看探針,使用網(wǎng)格單元規(guī)劃和計算軌跡(Erdem和Hasselmo, 2014年)。我們建議一個替代的但相關(guān)的解決方案。我們的建議還依賴于檢測兩組活動網(wǎng)格單元之間的差異,然而,我們建議這是在一個網(wǎng)格單元模塊一個網(wǎng)格單元模塊的基礎(chǔ)上完成的。我們將這些細胞稱為“置換細胞”(參見補充材料獲得更詳細的描述)。位移單元格類似于網(wǎng)格單元格,它們不能單獨表示一個獨特的位置。(在補充材料示例中,表示“向右2向上1”位移的位移單元格也會表示“向右5向上4”。)然而,多個位移單元格模塊中的單元格活動表示唯一的位移,就像多個網(wǎng)格單元格模塊中的單元格活動表示唯一的位置一樣,如圖3D所示。因此,一個單一的位移矢量可以代表咖啡杯上的標識在特定的相對位置。注意,位移矢量不僅表示兩個物體的相對位置,而且是兩個物體所獨有的。復雜的物體可以用一組位移向量來表示,這些位移向量定義了物體的組成部分以及它們之間的相對排列方式。這是一種表示和存儲對象結(jié)構(gòu)的高效方法。
這種表示對象的方法允許分層組合。例如,杯子上的標志也是由子對象組成的,如字母和圖形。將標識隱式地放置在杯子上的位移矢量攜帶了標識的所有子對象。該方法還允許遞歸結(jié)構(gòu)。例如,標識可以包含一個帶有標識的咖啡杯的圖片。層次和遞歸構(gòu)成不僅是物理對象的基本要素,也是語言、數(shù)學和其他智能思維表現(xiàn)形式的基本要素。其關(guān)鍵思想是,兩個之前學習過的對象,甚至是復雜對象的身份和相對位置,都可以用一個位移向量有效地表示出來。
網(wǎng)格單元格和位移單元格執(zhí)行互補操作
網(wǎng)格單元格根據(jù)當前位置和位移向量(即移動)確定新位置。位移單元確定從當前位置到達新位置所需的位移。
網(wǎng)格單元格:(位置1 + 位移 => 位置2)
位移單元格:(位置2 - 位置1 => 位移)
如果兩個位置在相同的空間中,那么網(wǎng)格單元格和位移單元格對導航很有用。在本例中,網(wǎng)格單元根據(jù)起始位置和給定的移動預測新位置。位移單元格表示從位置1到位置2所需的移動。
如果兩個位置位于不同的空間中(相對于兩個不同的物體,這是相同的物理位置),那么網(wǎng)格單元格和位移單元格用于表示兩個物體的相對位置。網(wǎng)格單元格根據(jù)給定的位移將一個對象空間中的位置轉(zhuǎn)換為第二個對象空間中的等效位置。在這種情況下,位移單元格表示兩個物體的相對位置。
我們認為所有皮層柱中都存在網(wǎng)格細胞和位移細胞。它們在基于位置的皮層處理框架中執(zhí)行兩種基本的和互補的操作。通過交替使用單個物體空間中的位置表示和兩個不同物體空間中的位置表示,新皮層可以使用網(wǎng)格細胞和位移細胞來學習物體的結(jié)構(gòu),并生成操作這些物體的行為。
內(nèi)嗅皮層中網(wǎng)格細胞的存在是有充分證據(jù)的。我們認為它們也存在于大腦皮層的所有區(qū)域。本文介紹了位移單元的存在預測。我們認為位移細胞也存在于新皮層的所有區(qū)域。考慮到位移細胞對網(wǎng)格細胞的補充作用,可能位移細胞也存在于海馬復合體中。
對象的行為
物體可以表現(xiàn)出行為。例如,考慮圖4中的訂書機。訂書機的頂部可以升起和旋轉(zhuǎn)。這個動作改變了訂書機的形態(tài),但不會改變它的特性。即使訂書機的整體形狀發(fā)生了變化,我們也不會將打開和關(guān)閉的訂書機視為兩個不同的物體。物體的一部分相對于物體的其他部分的運動是物體的一種“行為”。物體的行為是可以學習的,因此它們必須在皮層柱的神經(jīng)組織中表現(xiàn)出來。我們可以在基于位置的框架中表示行為,同樣使用位移向量。訂書機的上半部分和下半部分是訂書機的兩個組成部分。頂部和底部的相對位置用位移矢量表示,方法與標識和咖啡杯的相對位置相同。然而,與咖啡杯上的標志不同,訂書機的兩半可以相對移動。當訂書機頂部向上旋轉(zhuǎn)時,訂書機頂部到底部的位移發(fā)生變化。因此,訂書機頂部的旋轉(zhuǎn)由一系列位移向量表示。通過學習這個序列,系統(tǒng)將學習對象的這種行為。
打開和關(guān)閉訂書機是不同的行為,但它們由相同的位移元素組成,只是順序相反。這些有時被稱為“高階”序列。之前我們描述了一種在神經(jīng)元層中學習高階序列的神經(jīng)機制(Hawkins和Ahmad, 2016)。這種機制,如果應用到位移模塊,將允許學習、推斷和回憶對象的復雜行為序列。
"what"和"where"處理
感覺處理發(fā)生在兩個平行的新皮層區(qū)域,通常被稱為“什么”和“哪里”通路。在視覺方面,“what”通路或腹側(cè)通路的損傷與視覺識別物體能力的喪失有關(guān),而“where”通路或背側(cè)通路的損傷則與視覺識別物體能力的喪失有關(guān),即使它已經(jīng)被視覺識別。在其他感覺模式中也觀察到類似的“what”和“where”通路,因此這似乎是皮質(zhì)組織的一般原則(Goodale和Milner, 1992;Ungerleider和Haxby, 1994;改變路線,2015)。“what”和“where”的皮層區(qū)域有著相似的解剖結(jié)構(gòu),因此我們可以假設它們的工作原理相似。
基于位置的皮層功能框架既適用于“是什么”處理,也適用于“在哪里”處理。簡單地說,我們提出,“什么”區(qū)域和“哪里”區(qū)域之間的主要區(qū)別是,在“什么”區(qū)域,皮質(zhì)網(wǎng)格細胞表示在物體的位置空間中非中心的位置,而在“哪里”區(qū)域,皮質(zhì)網(wǎng)格細胞表示在身體的位置空間中以自我為中心的位置。圖5顯示了如何在“什么”和“哪里”區(qū)域生成代表運動的位移向量。所有人都知道的基本操作是,一個區(qū)域首先處理一個位置,然后再處理第二個位置。位移單元將決定從第一個位置移動到第二個位置所需的移動向量。在“what”區(qū)域(圖5C)中,這兩個位置位于一個對象的空間中,因此,位移向量將表示手指從對象上的第一個位置移動到對象上的第二個位置所需的移動。在這個例子中,“what”區(qū)域需要知道手指相對于杯子的位置,但它不需要知道杯子或手指相對于身體的位置。在“where”區(qū)域中,如圖5B所示,這兩個位置位于身體的空間中,因此,位移向量將表示如何從一個自我中心位置移動到第二個自我中心位置。“where”區(qū)域可以執(zhí)行這個計算,而不知道第二個位置的對象可能是什么,也可能不是什么。更詳細地討論“where”區(qū)域中的處理超出了本文的范圍。我們只想指出,通過假設不同的位置空間,可以使用類似的機制來理解“是什么”和“在哪里”處理。
重新思考等級制度,智力的千腦理論
新皮層的區(qū)域按等級組織(Felleman和Van Essen, 1991;Riesenhuber和Poggio, 1999;Markov et al., 2014)。人們普遍認為,當感官輸入進入新皮層時,第一個區(qū)域會檢測到簡單的特征。這個區(qū)域的輸出被傳遞到第二個區(qū)域,第二個區(qū)域?qū)⒑唵蔚奶卣鹘M合成更復雜的特征。這個過程不斷重復,直到在層次結(jié)構(gòu)的多個級別上,單元格響應完整的對象(圖6A)。新皮層作為特征提取器的層次結(jié)構(gòu)的這種觀點也是許多人工神經(jīng)網(wǎng)絡的基礎(chǔ)(LeCun et al., 2015)。
我們認為皮質(zhì)柱比目前認為的更強大。每個皮質(zhì)列學習完整對象的模型。他們通過將輸入與網(wǎng)格單元派生的位置相結(jié)合,然后對移動進行集成來實現(xiàn)這一目標(參見Hawkins等人,2017;劉易斯等人,2018年了解詳情)。這就提出了對皮層層次結(jié)構(gòu)的修正解釋,即在每個層次層次學習完整的對象模型,并且每個區(qū)域包含多個對象模型(圖6B)。
區(qū)域之間的前饋和反饋投射通常連接到層次結(jié)構(gòu)的多個層次(圖6中只顯示了一個層次的連接)。例如,視網(wǎng)膜投射到LGN中的丘腦中繼細胞,然后投射到皮層的V1、V2和V4區(qū)域,而不僅僅是V1。這種形式的“關(guān)卡跳過”是規(guī)則,而不是例外。因此,v1和V2都在某種程度上對視網(wǎng)膜輸入起作用。從LGN到V2的連接更加發(fā)散,說明V2在不同的空間尺度上學習模型。我們預測,V2中皮層網(wǎng)格細胞的空間尺度同樣會比V1中更大。輸入到一個區(qū)域的收斂水平,與其網(wǎng)格單元的空間尺度相匹配,決定了該區(qū)域可以學習的對象大小的范圍。例如,想象一下識別字母表中的印刷字母。在V1中,且僅在V1中可以識別最小大小的字母。直接輸入到V2將缺乏所需的特征分辨率。但是,較大的打印字母在V1和V2中都可以識別,甚至更大的字母在V1中可能太大,但在V2中可以識別。分層處理仍然存在。我們所建議的是,當一個區(qū)域(如V1)將信息傳遞給另一個區(qū)域(如V2)時,它不是傳遞未分類特征的表示,而是傳遞完整對象的表示,如果可以的話。如果像Hawkins等人(2017)提出的那樣,用人口編碼來表示對象,這將很難在經(jīng)驗上觀察到。單個神經(jīng)元會參與許多不同的物體表征,如果單獨觀察,它們似乎代表感官特征,而不是物體。皮質(zhì)列可以學習的對象數(shù)量很大,但有限(Hawkins et al., 2017)。不是每一列都能學習到每一個對象。系統(tǒng)容量的分析需要對層級流有更深入的理解,這超出了本文的范圍。
有許多皮質(zhì)-皮質(zhì)投影與純分層處理不一致(圖6B,綠色箭頭)。例如,在左右半球的區(qū)域之間有長距離的投射(Clarke和Zaidel, 1994),在不同感覺模式的區(qū)域之間有無數(shù)的連接,甚至在層次結(jié)構(gòu)的最低水平(Schroeder和Foxe, 2005;Driver和Noesselt, 2008;Suter和Shepherd, 2015)。這些連接可能不是分層的,因為它們的軸突終止于與前饋或反饋輸入相關(guān)的細胞層外的細胞。據(jù)估計,實際存在的所有可能的區(qū)域間聯(lián)系中有40%是存在的,這比純層次結(jié)構(gòu)所暗示的要大得多(Felleman和Van Essen, 1991)。這些遠程非等級連接的目的是什么?在Hawkins等人(2017)中,我們提出在柱的某些層(如L4和L6)中的細胞活性隨著每一個新的感覺而變化,而在其他層(如L2/3)中,代表觀察到的“對象”的細胞活性在變化的輸入中是穩(wěn)定的。我們展示了“對象”層中的遠程關(guān)聯(lián)連接如何允許多個列對它們當前觀察的對象進行投票。例如,如果我們看到并觸摸一個咖啡杯,就會有許多柱同時觀察杯子的不同部分。這些列將在視覺和軀體感覺層次的多個層次。每一列都有獨特的感官輸入和獨特的位置,因此,代表位置和輸入的細胞之間的遠程連接是沒有意義的。然而,如果列正在觀察相同的對象,那么對象層中單元格之間的連接允許列快速停留在正確的對象上。因此,如果兩個區(qū)域經(jīng)常同時觀察同一物體,那么任何兩個區(qū)域之間的無等級連接,甚至是不同感覺模式下的主感覺區(qū)和次感覺區(qū)之間的無等級連接是有意義的(詳見Hawkins et al., 2017)。
關(guān)于知覺的一個經(jīng)典問題是,新皮層如何將不同的感官輸入融合到一個感知對象的統(tǒng)一模型中。我們認為新皮層實現(xiàn)了一種分散的傳感器融合模型。例如,沒有一個單一的咖啡杯模型包含了杯子的感覺和外觀。相反,一個杯子有上百種型號。每個模型都是基于不同感覺模式下的一個獨特的感覺輸入子集。將會有基于視覺輸入的多個模型和基于體感輸入的多個模型。每個模型都可以通過觀察相關(guān)傳感器的運動輸入來推斷杯子。然而,遠程非層次連接允許模型快速地就底層對象的身份達成一致,通常是在單一的感覺中。
僅僅因為每個區(qū)域?qū)W習對象的完整模型并不排除分層流。主要觀點是,大腦皮層有100個,可能是1000個,世界上每個物體的模型。觀察到的特征的集成不僅發(fā)生在層次結(jié)構(gòu)的頂部,它發(fā)生在層次結(jié)構(gòu)的所有級別的每一列中。我們稱之為“智力的千腦理論”。
討論
克里克(1979)寫了一篇題為“思考大腦”的文章。他在書中寫道:“盡管我們不斷積累詳細的知識,但人類大腦是如何工作的仍是一個非常神秘的問題。”他假設,在未來幾年里,我們無疑會積累更多關(guān)于大腦的數(shù)據(jù),但這可能并不重要,因為“我們對這類問題的整個思考方式可能是錯誤的。”他的結(jié)論是,我們?nèi)狈σ粋€“理論框架”,在這個框架中,我們可以解釋實驗結(jié)果,也可以應用詳細的理論。克里克寫了這篇文章近40年后,他的觀察在很大程度上仍然有效。
可以說,我們在建立理論框架方面取得的最大進展是基于海馬復合體中的位置細胞和網(wǎng)格細胞的發(fā)現(xiàn)。這些發(fā)現(xiàn)為動物如何學習環(huán)境地圖以及它們?nèi)绾问褂眠@些地圖在世界中導航提供了一個框架。這個框架的成功引起了人們對內(nèi)嗅皮層和海馬體研究的興趣。
在這篇論文中,我們提出了一個理解新皮層的理論框架。我們提出的皮層框架是由網(wǎng)格細胞和位置細胞建立的框架的衍生物。用于學習環(huán)境結(jié)構(gòu)的機制現(xiàn)在被應用于學習對象的結(jié)構(gòu)。用來追蹤動物在其環(huán)境中的位置的機制,現(xiàn)在被應用于追蹤肢體和感覺器官相對于世界上物體的位置。這個類比能走多遠還不確定。在海馬體、下丘腦和內(nèi)嗅皮層形成的回路中,有網(wǎng)格細胞(Hafting等人,2005)、位置細胞(O 'Keefe和Dostrovsky, 1971;O 'Keefe和Burgess, 2005),頭部方向細胞(Taube等,1990;Giocomo等,2014;Winter等人,2015年)、邊界細胞(Lever等人,2009年)、對象載體細胞(Deshmukh和Knierim, 2013年),以及其他,以及許多表現(xiàn)出這些組合特性的結(jié)合體細胞(Sargolini等人,2006年;布蘭登等,2011;Stensola等,2012;Hardcastle et al ., 2017)。我們目前正在探索的想法是,新皮層包含的細胞具有與海馬體復合體中發(fā)現(xiàn)的各種細胞相同的功能。這些細胞的特性只有在一個清醒的、積極感知學習對象的動物身上才能被檢測到。Long和Zhang(2018)最近的工作表明這可能是正確的。
方向
在內(nèi)嗅皮層和大腦的其他地方,發(fā)現(xiàn)了頭向細胞(Taube et al., 1990;Sargolini等人,2006;布蘭登等,2011;Giocomo等,2014;溫特等,2015;Raudies等人,2016)。這些細胞代表了動物相對于環(huán)境的異心定向。通過感覺推斷你的位置,預測你移動后的感覺,以及決定如何移動以到達一個新位置,這些都需要了解你當前相對于環(huán)境的方向。在sselmo(2009)和Hasselmo等人(2010)回顧的模型中,頭部方向單元對于在空間位置之間的精確過渡是至關(guān)重要的。同樣的定向需求存在于整個大腦皮層。例如,只知道手指在咖啡杯上的特定位置是不夠的。手指也有相對于杯子的方向(它旋轉(zhuǎn)的方式和接觸時的角度)。預測手指接觸杯子時的感覺,或者到達杯子上的新位置需要什么動作,除了需要知道手指的位置之外,還需要知道手指相對于杯子的方向。因此,我們預測在每個皮質(zhì)柱中都有一個方向的表征,它執(zhí)行類似于海馬復合體中的頭部方向細胞的功能。定向在大腦皮層中是如何表現(xiàn)的尚不清楚。可能有一組定向細胞,每個細胞都有一個偏好的方向,類似于頭部定向細胞,但我們沒有發(fā)現(xiàn)任何證據(jù)。或者,方向可以通過人口編碼表示,這將更難以檢測。例如,在體感區(qū)域,定向可以通過激活自我中心定向探測器的稀疏子集來表示(Hsiao等人,2002;Bensmaia等人,2008;Pruszynski和Johansson, 2014)。定向是如何表示的,以及如何與皮層網(wǎng)格細胞和位移細胞相互作用,這在很大程度上是未知的。這是我們正在積極研究的一個領(lǐng)域。
預測
皮質(zhì)功能的許多理論背后一個長期存在的原則是預測(Lashley, 1951;Rao和Ballard, 1999;Hawkins和Blakeslee, 2004;洛特等人,2018)。通過表示傳感器的位置,皮質(zhì)柱可以在每個物體的位置空間中關(guān)聯(lián)感官信息,類似于位置細胞將感官信息與位置關(guān)聯(lián)的方式(O 'Keefe and Nadel, 1978;Komorowski et al., 2009)。這使專欄能夠構(gòu)建強大的預測模型。例如,當你的手指從杯子底部移動到頂部時,不管杯子如何相對于傳感器旋轉(zhuǎn),它都可以預測感覺。使用位移單元格表示復合對象使列能夠歸納和預測感覺,即使在遇到新對象時也是如此。例如,假設我們看到一個有熟悉標志的杯子(圖3A),而標志的部分是模糊的。一旦一個列識別了標識和杯子,它就可以預測整個標識與杯子的關(guān)系,即使這個組合對象是新的。如果沒有明確的位置表示,構(gòu)建這樣的預測模型將會困難得多。在之前的論文中,我們提出了可以作為預測網(wǎng)絡神經(jīng)基礎(chǔ)的樹突機制(Hawkins和Ahmad, 2016;Hawkins等人,2017)。總的來說,預測是本文討論的大部分框架的基礎(chǔ)。
注意力
基于位置的大腦皮層處理框架的一個關(guān)鍵元素是大腦皮層區(qū)域在物體空間之間快速切換的能力。要知道咖啡杯上有一個標志,我們需要在杯子和標志之間交替注意。隨著注意力的每一次轉(zhuǎn)移,皮質(zhì)網(wǎng)格細胞會重新錨定到新參與的物體的位置空間。這種轉(zhuǎn)移到一個新的對象空間是必要的,以表示兩個對象之間的位移,如標識和杯子。不斷地在周圍的物體之間轉(zhuǎn)移注意力是很正常的。對于每一個新參與的對象,皮質(zhì)網(wǎng)格細胞在新對象的空間中重新錨定,而位移細胞表示新對象相對于先前參與的對象的位置。注意力的變化與傳感器的運動、網(wǎng)格細胞的重新錨定,以及人們普遍認為的丘腦的反饋信號密切相關(guān)(克里克,1984;McAlonan et al., 2006),大概是為了選擇一個輸入子集進行處理。人們對這些元素如何協(xié)同工作知之甚少,這是一個有待進一步研究的領(lǐng)域。
位置代碼的唯一性
我們的建議是基于這樣一種想法:一組網(wǎng)格單元模塊可以編碼大量的惟一位置。有一些觀察表明,網(wǎng)格細胞本身可能無法形成足夠的唯一代碼。例如,因為每個網(wǎng)格單元在相當大的物理空間區(qū)域顯示活動(Hafting等人,2005年),網(wǎng)格單元模塊中細胞的激活不是非常稀疏。稀疏性有助于創(chuàng)建易于識別的惟一代碼。稀疏性的缺乏可以通過對更多網(wǎng)格單元模塊的活動進行采樣來克服,但我們對網(wǎng)格單元模塊的大小以及有多少可以實際采樣還知之甚少(Gu等人,2018年)已經(jīng)表明,網(wǎng)格單元模塊是由獨立激活的更小的子單元組成的,這也將增加網(wǎng)格單元的表示能力。另一個影響能力的因素是結(jié)膜細胞。內(nèi)嗅皮層的結(jié)膜細胞多于單純的網(wǎng)格細胞。結(jié)膜細胞表現(xiàn)出某種“網(wǎng)格”+定向和/或其他因素的組合(Sargolini et al., 2006)。連接細胞可能比純網(wǎng)格細胞具有更稀疏的激活,因此將是形成一組唯一位置代碼的更好基礎(chǔ)。如果新皮層有類似結(jié)膜細胞的細胞,它們也可能在位置編碼中發(fā)揮作用。對于網(wǎng)格細胞、定向細胞和連接細胞是如何協(xié)同工作的,我們還沒有足夠的知識來說明位置是如何在新皮層中編碼的。隨著我們對大腦皮層中位置編碼的了解越來越多,記住這些可能性是很重要的。
新皮層中的網(wǎng)格細胞和位移細胞在哪里?
新皮層通常分為六層,與表面平行。有幾十種不同的細胞類型,因此,每一層都包含多種細胞類型。一些證據(jù)表明,皮層網(wǎng)格細胞位于L6[特別是L6皮質(zhì)-皮質(zhì)神經(jīng)元(Thomson, 2010)],而位移細胞位于L5(特別是L5厚簇神經(jīng)元)(圖7)。
L4和L6之間不尋常的連通性是證明L6中存在皮層網(wǎng)格細胞的一個證據(jù)。L4是主要輸入層。然而,前饋輸入在L4細胞上形成的突觸不到10% (Ahmed et al., 1994,1997;Sherman和Guillery, 2013),而L4細胞上約45%的突觸來自L6a皮質(zhì)-皮質(zhì)神經(jīng)元(Ahmed et al., 1994;Inzegger et al., 2004)。類似地,L4細胞在相同的L6細胞上產(chǎn)生大量的突觸(McGuire et al., 1984;賓辛格等人,2004;Kim et al., 2014)。此外,L6和L4之間的聯(lián)系在傳播上相對狹窄(Binzegger et al., 2004)。L6和L4之間的狹窄連接讓人聯(lián)想到MEC中的網(wǎng)格細胞和海馬中的位置細胞之間的拓撲對齊的雙向連接(Rowland et al., 2013;Zhang et al., 2013)。我們之前展示了L6和L4之間的互易連接如何通過傳感器的運動來學習物體的結(jié)構(gòu),如果L6代表物體空間中的一個位置(Lewis et al., 2018)。對于以這種方式學習物體結(jié)構(gòu)的柱,需要接收感官輸入的細胞和表示位置的細胞之間的雙向連接。L6a是已知的唯一一組滿足這一要求的細胞。此外,網(wǎng)格單元使用電機輸入來更新它們的表示,以實現(xiàn)路徑集成。實驗顯示L6有明顯的運動投影(Nelson et al., 2013;Leinweber et al., 2017)。不幸的是,目前關(guān)于新皮層中網(wǎng)格細胞存在的實驗證據(jù)無法說明哪些皮層層包含網(wǎng)格細胞。在不久的將來,應該可以通過實驗來確定這一點。我們預測他們會在L6。
位移細胞存在于L5的主要證據(jù)還是連通性。L5細胞的一個子集(被稱為“L5厚簇細胞”),據(jù)我們所知,存在于所有的皮層區(qū)域,投射到與運動行為有關(guān)的大腦區(qū)域的皮層下。(例如,視覺皮層的L5細胞投射到控制眼球運動的上丘。)這些L5細胞是大腦皮層的運動輸出細胞。然而,同樣的L5細胞將軸突的一個分支發(fā)送到丘腦中繼核,然后投射到等級較高的皮層區(qū)域(Douglas and Martin, 2004;Guillery和Sherman, 2011;Sherman和Guillery, 2011)。很難理解為什么相同的L5單元可以同時作為電機輸出和前饋輸入到其他區(qū)域。Guillery和Sherman提出的一種解釋是,L5細胞代表運動指令,前饋L5投影可以被解釋為運動指令的傳出副本(Guillery和Sherman, 2002,2011)。
我們提供了另一種可能的解釋。L5細胞是位移細胞,它們交替表示運動(通過皮層下發(fā)送),然后表示合成物體(通過丘腦中繼細胞發(fā)送到更高的區(qū)域)。如上所述,當比較同一空間中的兩個位置時,位移單元格將表示一個移動向量,當比較兩個不同空間中的兩個位置時,位移單元格將表示復合對象。這兩個快速變化的表示可以在它們的目的地消除歧義
通過振蕩周期的相位或生理放電模式(Burgess等人,2007年;Hasselmo, 2008;Hasselmo和Brandon, 2012)。盡管我們還遠遠沒有完全理解不同的細胞層是做什么的以及它們是如何一起工作的,但基于位置的框架提供了一個重新審視大量皮質(zhì)解剖學和生理學文獻的機會,并在這個問題上取得進展。
基于位置的高水平思維和智力框架
我們已經(jīng)用感官推理的例子描述了我們的基于位置的框架。考慮到所有皮層區(qū)域的解剖結(jié)構(gòu)都非常相似,很有可能新皮層所做的一切,包括語言和其他高級思維形式,都將建立在相同的基于位置的框架之上。為了支持這一觀點,目前關(guān)于網(wǎng)格細胞存在于新皮層的經(jīng)驗證據(jù)是從執(zhí)行所謂的“認知任務”的人類身上收集的,它是在遠離直接感覺輸入的皮層區(qū)域被檢測到的(Doeller et al., 2010;Jacobs等,2013;Constantinescu et al., 2016)。
基于位置的框架可以應用于物理結(jié)構(gòu),如杯子,和抽象概念,如數(shù)學和語言。皮層列基本上是一個學習預測模型的系統(tǒng)。模型是從導致輸入變化的輸入和運動中學習的。成功的模型是能夠根據(jù)當前狀態(tài)和預期運動預測下一個輸入的模型。然而,皮質(zhì)柱的“輸入”和“運動”不必與物理實體相對應。對一列的“輸入”可以來自視網(wǎng)膜,也可以來自大腦皮層的其他區(qū)域,這些區(qū)域已經(jīng)識別了一個視覺對象,如一個單詞或一個數(shù)學表達式。“運動”可以表示眼睛的運動,也可以表示抽象的運動,如動詞或數(shù)學運算符。
成功學習預測模型需要發(fā)現(xiàn)對象空間的正確維度,學習運動如何更新該空間中的位置,并將輸入特征與對象空間中的特定位置聯(lián)系起來。這些屬性既適用于感官知覺,也適用于高級思維。想象一下,一根柱子試圖通過視網(wǎng)膜的視覺輸入和手指的運動輸入來學習一個杯子的模型。這將會失敗,因為手指所穿過的位置不會映射到物體的特征空間上,這是由眼睛輸入的變化所證明的。類似地,當你試圖理解一個數(shù)學問題時,如果你使用一個算子來處理一個方程,你可能會失敗,而使用另一個算子則會成功。
大腦皮層中的網(wǎng)格細胞表明,所有的知識都是在位置和位置空間的背景下學習和存儲的,而“思考”就是在這些位置空間中移動。在了解大腦皮層如何執(zhí)行認知功能的細節(jié)之前,我們還有很長的路要走。然而,我們相信,基于位置的框架不僅將是解決這些問題的核心,而且將提供解決方案。
結(jié)論
人們有時說神經(jīng)科學“數(shù)據(jù)豐富,理論匱乏”。這一概念在大腦皮層中尤其正確。我們?nèi)狈Φ牟皇墙?jīng)驗數(shù)據(jù),而是一個理論框架,可以彌合感知、認知和智力的異質(zhì)能力與新皮層中觀察到的同質(zhì)回路之間的差距。目前我們所擁有的最接近這種框架的是分層特征提取,但這被廣泛認為是不夠的。
發(fā)展新皮層功能理論的一種方法是基于詳細的解剖數(shù)據(jù)建立皮質(zhì)柱的硅內(nèi)模型(Helmstaedter等人,2007;Markram等,2015)。該方法從解剖學入手,希望通過模擬皮質(zhì)柱來發(fā)現(xiàn)理論原理。我們用了不同的方法。我們從一個我們知道的新皮層執(zhí)行的詳細功能(如感覺運動學習和推理)開始,我們推導出執(zhí)行這些功能所需的神經(jīng)機制(如代表位置的細胞),然后將這些神經(jīng)機制映射到詳細的生物數(shù)據(jù)上。
基于這種方法,本文提出了一個新的框架來理解新皮層是如何工作的。我們認為網(wǎng)格細胞在大腦皮層中無處不在。皮層網(wǎng)格細胞在被觀察物體的參考坐標系中追蹤輸入到新皮層的位置。我們提出了一種新的神經(jīng)元——位移細胞的存在,它是網(wǎng)格細胞的補充,并且同樣存在于整個新皮層中。這個框架展示了一小塊大腦皮層如何能夠表現(xiàn)和學習物體的形態(tài),物體是如何組成其他物體的,以及物體的行為。該框架也導致了對新皮層如何整體工作的新解釋。新大腦皮層不是通過一系列特征提取步驟來處理輸入,從而在層次結(jié)構(gòu)的頂端識別物體,而是由1000個模型組成,并行地、分層地運行。
自省有時可以揭示被更客觀的實驗技術(shù)遺漏的基本真相。在我們每天的生活中,我們會感知到成千上萬的物體,比如樹木、印刷的和口語的文字、建筑物和人。一切都在一個位置被感知。當我們注意到每一個物體時,我們感知到我們與這些物體之間的距離和方向,我們感知到它們彼此之間的相對位置。位置和距離的感覺是知覺固有的,它的發(fā)生無需努力或延遲。不言而喻的是,當我們連續(xù)注意物體時,大腦必須對物體的位置和物體之間的距離有神經(jīng)表征。我們的主張的新奇之處在于,這些位置和距離是在新皮層的任何地方計算出來的,它們是皮層功能、知覺和智力的主要數(shù)據(jù)類型。
作者貢獻
JH與ML、MK、SP和SA一起構(gòu)想了神經(jīng)科學的總體理論和映射。JH和SA一起完成了大部分的手稿。ML、MK和SP參與了手稿的撰寫、編輯和修改。
資金
Numenta是一家私人控股公司。它的資金來源是獨立的投資者和風險投資家。
致謝
我們感謝審稿人的許多有用的和詳細的評論,這些評論大大改進了整個稿件。我們感謝David Eagleman、Weinan Sun、Michael Hasselmo和Mehmet Fatih Yanik對本文的反饋和幫助。我們還要感謝Numenta多年來的眾多合作者,特別是Donna Dubinsky、Christy Maver、Celeste Baranski、Luiz Scheinkman和Teri Fry。我們還注意到,本文的一個版本已發(fā)布到預印本服務器bioRxiv (Hawkins等人,2018年)。
補充材料
本文的補充材料可以在網(wǎng)上找到: https://www.frontiersin.org/articles/10.3389/fncir.2018.00121/full#supplementary-material
參考文獻
Ahmed, B., Anderson, J. C., Douglas, R. J., Martin, K. A., and Nelson, J. C. (1994).
Polyneuronal innervation of spiny stellate neurons in cat visual cortex. J. Comp.
Neurol. 341, 16–24. doi: 10.1002/cne.903410103
…
…
…
總結(jié)
以上是生活随笔為你收集整理的脑皮质算法(2)一种基于新皮层网格细胞的智能和皮质功能的框架的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python3中的可变与不可变类型
- 下一篇: Django model中的 class