视觉系统:人类最重要的感觉
總目錄(持續更新中)
- (零)前言
- (一)視覺系統的全貌
- (二)光線如何被眼睛檢測到?
- 眼球
- 視網膜
- 色覺的來源
- 視網膜是嚴重貧富不均的
- 視網膜能提取圖像的輪廓信息
- 視網膜是倒置的
- (三)視覺信號如何傳入大腦?
- 外側膝狀體
- 視交叉上核
- 上丘
- (四)視覺信號在大腦中被重組、扭曲全過程!
- 視交叉“拆分”視野
- 外側膝狀體“重組”視野
- 視野在大腦內部的樣子
- (五)視覺信號在大腦中的第一站:外側膝狀體
- 視覺信號中繼站
- 視覺特征檢測功能涌現
- 大細胞和小細胞兩個通道
- 參與調節機體認知狀態
- (六)“虛擬視覺”第一步:理解初級視覺皮層
- 感受野(receptive field)
- 大腦皮層的分層結構
- 給光、撤光反應(ON/OFF response)
- 方位選擇性(orientation selectivity)
- “正弦光柵”與空間頻率、時間頻率(sinusoidal grating、spatial frequency、temporal frequency)
- 眼優勢(ocular dominance)
- 皮層功能柱(cortical functional column)
- (七)視覺信號在大腦中的第三站:高級視覺皮層們
(零)前言
近期打算和小伙伴一起,創作一個專欄,專門講解人類最重要的感覺系統:視覺系統。
本人在視覺神經科學的科研一線浸潤多年,具備扎實深入的專業知識,也有豐富的科普文章寫作經歷,希望用專業而簡明易懂的文字,配合可愛活潑的插圖,幫助大家了解“我如何看到世界”這一重要問題。
除了目前在目錄中已經占坑的題目,更多專題內容正在創作中,敬請期待!
(劇透:“臉盲”、“漢字順序不影響閱讀”、“虛擬視覺”、“大腦的欺騙”、“視覺錯覺”、“潛意識與意識”等題目已經在醞釀中!)
如果想繼續深入淺出了解“視覺”,請收藏本文章,我將在文章內不斷更新內容。
(最新更新:(六)“虛擬視覺”第一步:理解初級視覺皮層,2020.4.22)
如果想了解專業的神經生物學科普內容,請關注知乎:殷尚墨羽
如果想了解更多有趣的神經生物學科研生活,請關注微信公眾號:復尚神經屋(微信ID:FDU_Neuron)
如果想了解更多生物學相關教學視頻,請關注bilibili:殷尚墨羽的個人空間
放一張我和實驗室老朋友們的合影:
2020.4.1
于復旦大學生命科學學院
(一)視覺系統的全貌
視覺系統是人類最為重要的感覺系統(沒有之一),人的大腦皮層有三分之一的面積都和視覺有關。人從外界接受的信息中,視覺占據絕大多數,并且能夠有力影響人們的認知、決策、情感乃至于潛意識活動(具體內容,請期待后續更新)。
從這個角度來看,把人稱為“視覺動物”也不為過。
因此,我希望結合自身在視覺神經生物學一線的科研背景,結合最新的學界成果,與優秀的插圖作家 @高林夏 一起,講解大家最為關心的“視覺”問題:
1. 【基礎】人類如何“看到”世界?
2. 【基礎】視覺信息如何被大腦處理?
3. 【進階】視覺系統如何欺騙我們(比如視錯覺)
4. 【進階】視覺相關的學習與記憶
5. 【進階】視覺和大腦高級功能的關系(認知、意識等)
為了解答上述問題,我們首先需要了解“視覺系統長什么樣子”。
話不多說,先上圖(請耐心看完噢)。
視覺系統全局圖(by 高林夏):
眾所周知,人要看到東西,首先要有光,之后要有眼睛。為了處理眼睛看到的內容,需要一個腦子。具體來講,人想要看到一個東西(指的是“人意識到自己看到了東西”),需要經歷如下的“三級跳”過程:
1. 光線進入眼睛
2. 眼睛把光線攜帶的信息轉化成電信號,傳給大腦
3. 大腦對視覺信號進行處理,變成視覺體驗,并影響人的行為和思想
然而,上述過程還是太簡略了,我們用專業的術語,詳細描述一下:
光(本質是電磁波)攜帶著外部世界的結構信息,經過一系列折光系統(如晶狀體、玻璃體等),投射在眼球底部的視網膜上。
視網膜上的光感受器細胞,將光信號轉換為電信號(光電轉換),傳遞給視網膜的其他細胞(比如雙極細胞、水平細胞、無長突細胞等),進行初步的信息整合加工。
視網膜的各種細胞最終將整合好的信號,傳遞給視網膜神經節細胞,由它將視覺信息通過視神經,傳遞進入大腦。
視覺信息進入大腦后,先進入位于丘腦的一個小小的核團——外側膝狀體。在那里,視覺信息被進一步整合加工,關鍵的視覺信息被提取出來,無用的信息被舍棄或扣留在低級腦區。經過加工后的關鍵視覺信息,通過名為“視放射”的神經纖維束,傳遞到初級視覺皮層。
初級視覺皮層進一步提取視覺信息中的關鍵特征(比如朝向信息、運動信息、色彩信息等),向高級的視覺皮層傳遞。
高級視覺皮層有好多個區域,它們各司其職,有的專門負責檢測運動,有的專門負責檢測形狀,有的專門負責識別人臉……它們通過等級森嚴的協同分工,共同完成了對視覺信號的處理,并將最終結果傳遞給其他腦區,從而影響人的行為和思想。
但故事沒有結束,高級腦區還能反過來,影響初級腦區,調節初級腦區的敏感性和偏好性(甚至能調節眼球的細微轉動軌跡),從而更加精細地控制信息流的入口,幫助大腦更加精細地認識外在世界。
到此為止,一個完整而專業的視覺系統框架就搭建完成了。
上述的框架至關重要,如果想要理解人類的視覺,就必須對其心里有數。
我后續更新的文章,就會對上述每一條的細節,用深入淺出和形象插圖的方式,幫助大家理解。
2020.4.3
于復旦大學生命科學學院
(二)光線如何被眼睛檢測到?
在第一篇文章中,我們已經了解了視覺信息被大腦處理的全過程。現在,我們把目光投向一切的起點——眼睛。
實際上,人們提起“視覺”,首先想到的幾乎都是“眼睛”。但其實眼睛只負責“視”的最初步驟,“覺”的部分主要由大腦來完成。“視”與“覺”不可分離,要講“視覺”,眼睛和大腦也不能割裂開來講解。
(更進一步:許多神經科學家們把眼睛視作大腦的一部分——“外圍腦”。支持這一觀點的證據有很多,也許會在將來專門撰文講述)
我們首先復習第一篇文章里,關于眼睛部分的文字:
我國的近視率一直在上升,人們從小就接觸各種視力健康方面的知識,所以我相信許多人都已經對眼球的結構有所了解。這一部分我將簡要帶過,著重講視覺信息處理的部分。
眼球
眼球可以簡單分為三個部分:
我們平時戴眼鏡,主要是為了輔助眼球折光系統的工作,確保在視網膜上清晰成像。而如果我們關注“視覺”,那就要著重講第三點:眼球的感光系統——視網膜。
視網膜
視網膜是分層的(大腦皮層也是分層的),每一層都有不同的細胞,負責不同的功能。
嚴格來講,視網膜可以分為10層,分別是:
但上述分層過于細致,為了便于理解,我們簡單將視網膜的結構分為四個部分:
這樣一來,我們就對視網膜的構造和功能有了基本的概念。
當然,其中的細節也是極其豐富的,限于篇幅,我們了解幾個最為關鍵的方面即可:
色覺的來源
視網膜的光感受器細胞可以大致分為兩類:視桿細胞、視錐細胞。它們的形狀有明顯區別(見下圖),同時功能上也很不一樣。
視桿細胞對光極為敏感,非常微弱的光就可以激活它。因此,它是我們能在黑暗環境中看清東西的原因。但人眼中的視桿細胞只有一種類型,所以單靠它無法獲得顏色信息,我們在黑暗中很難分辨物體的顏色,原因就在于此。
而視錐細胞不同,它雖然對光不太敏感,但是種類比視桿細胞多——**在人眼中,有三種視錐細胞,它們分別喜愛紅光、綠光和藍光。三種視錐細胞對同一束光的反應強度有所區別,就可以共同編碼“顏色”**的信息了。
我們日常使用的RGB三原色系統,可以通過紅綠藍三種顏色的不同組合,獲得無數種顏色。這就和視錐細胞編碼色彩的原理相同。
視網膜是嚴重貧富不均的
視網膜就像一張膜,但并不是均勻的膜。它的中央區域細胞最為密集,但周邊區域細胞比較稀疏——有點像大型城市的人口密度分布。因此人類對視野中央的東西看得最清楚(分辨率最高),而視野邊緣的東西就看不清楚(分辨率比較低),需要轉動眼球才能看清。
放一張我用windows自帶“畫圖”軟件制作的靈魂手繪圖,方便大家理解“中央密集,周邊稀疏”的含義:
視網膜能提取圖像的輪廓信息
視網膜對視覺信息做了初步的整合處理,可以從中提取出“輪廓信息”。這是中間神經細胞們的功勞,它們構成的興奮-抑制神經網絡,賦予神經節細胞識別輪廓的能力。專業點說,就是讓神經節細胞對感受野(這個細胞負責的視野區域)內部視覺信號的處理方式上,產生了中心-周邊拮抗的同心圓結構。
其實,目前非常非常熱門的**“深度學習”、“卷積神經網絡”中,就廣泛借鑒了神經節細胞的這種能力。神經節細胞的同心圓拮抗感受野,對應了卷積神經網絡里邊的“雙高斯差卷積核”(也有人用“拉普拉斯算子”來對應它,比如David Marr),它可以對原始輸入圖像做卷積運算**,從而提取出原始圖像中“亮度變化最快”的區域——通常是圖像的輪廓。
下圖:一個“中心-周邊拮抗同心圓”結構的卷積核案例
下圖:上圖中的“中心-周邊拮抗同心圓”結構的卷積核提取圖像輪廓信息前后對比
來源:Computer Vision I - Introduction to Computer Vision課程資料,Robert Collins (Penn State University)
關于“中心-周邊拮抗的感受野”這一話題,我以后會專門撰文講解——它對于我們提取外部世界的“結構信息”至關重要。只有提取了外部世界的結構信息,我們才能把物體和背景區分開,否則,世界在我們眼中就是一片“未分化的混沌”。
視網膜是倒置的
如果你仔細看了視網膜的分層結構圖,就會發現——光線進入眼球,先通過密密麻麻的細胞群,再照射在光感受器細胞上面。換句話說,光感受器細胞上方,懸了一層厚厚的毛玻璃。這會影響到信號質量嗎?當然會!
但是,人類(以及其他高等哺乳動物)為何偏偏選擇了這樣一種看起來極不合理的構造呢?要知道,低等動物章魚的視網膜,看起來都要更合理一些——章魚的視網膜和人的視網膜正好相反,光最先照在感受器細胞上(見下圖)。
上圖中,1 = 視網膜;2 = 神經纖維;3 = 視神經;4 = 人類的盲點,由視神經穿過視網膜造成
原因至少有兩點:
高等哺乳動物的視覺系統比較發達,光感受器細胞數量極其巨大,而光電轉換的耗能是非常高的。為了能夠提供充足的能量,光感受器細胞層必須緊貼著供能的基底層(色素上皮層)——否則將無法支持如此多的光感受器細胞存活。
“進化是一個修補匠”,它只能在原有的基礎上修修補補,具有很高的路徑依賴性。因此,高等哺乳動物的共同祖先的微小變化,就會決定未來后代們的進化走向。也許正是“倒置視網膜”的小小差錯,讓視網膜成功滋養了大量的細胞,從而使得視覺系統的地位愈發重要,最終讓人類成為了“視覺動物”(而非“聽覺動物”、“觸覺動物”、“嗅覺動物”)呢?
我們已經知道視覺信息如何在視網膜內部進行處理了,下一篇文章,我們聊一聊:視覺信號如何傳入大腦?信號在大腦中處理的方式,才真正決定了我們如何“看到”世界。
敬請關注!
2020.4.4
于復旦大學生命科學學院
(三)視覺信號如何傳入大腦?
上一篇文章中,我們聊了“眼睛”在視覺中發揮的作用。
這一次,我們談一談視覺信號離開眼睛以后,如何進入大腦,以及具體去了大腦的哪些地方。
首先看圖:
視覺信號沿著視神經(也就是神經節細胞的軸突)離開眼球以后,首先會到達視交叉(optic chiasma)。
視交叉是一個神奇的地方,它像是一個物流分選站,將來自兩只眼睛的信號重新拆分組裝:
提示:請仔細看上圖中“視交叉”的位置。
放一張大腦解剖圖,看一下真實人腦中的“視交叉”長什么樣子(下圖中淺色“X”結構的中央位置就是視交叉):
圖片來源:https://www.neurosurgicalatlas.com/neuroanatomy/ventral-surface-of-brain-showing-the-optic-chiasm-hypothalamus-and-circle-o
總結:我們的雙側視野,被傳入了對側的大腦。(巧合的是,我們的四肢也是對側大腦支配的)
隨后相當久的時間(長達一百毫秒)內,視覺信號基本上只在半側大腦里邊活動了。它們離開視交叉之后,首先要去三個重要的地方,一個是位于丘腦的“外側膝狀體”(lateral geniculate nucleus),一個是在視交叉上方的“視交叉上核”(suprachiasmatic nucleus),還有一個是位于中腦四疊體的“上丘”(superior colliculus)。
外側膝狀體
外側膝狀體將負責視覺信息的進一步處理。視覺信息在這里被再次拆分、扭曲、組裝、打包,通過視放射(optic radiation)傳遞到初級視覺皮層。我們稱之為“視覺的第一通路”,它是我們熟悉的視覺功能的來源。(既然有“第一通路”,當然還會有“第二通路”,我們可以之后專文介紹)
提供一張我認為很清晰的視放射和外側膝狀體的大腦解剖圖:
(考慮到部分讀者也許對大腦解剖接觸有限,為了避免不必要的視覺沖擊,圖就不放在正文里了。感興趣的朋友可以點開網址鏈接查看)https://www.neurosurgicalatlas.com/neuroanatomy/basal-view-of-the-neural-visual-pathways
(圖中LatGeBo=外側膝狀體;OptRad=視放射;OpCh=視交叉;OptTr=視束)
視交叉上核
文獻出處:《Suprachiasmatic Nucleus: Cell Autonomy and Network Properties》
鏈接:https://www.annualreviews.org/doi/10.1146/annurev-physiol-021909-135919
視交叉上核與生物節律密切相關(上方動態圖就展示了它周期性表達生物節律相關蛋白的現象)。生物節律,也叫做“生物鐘”,影響到我們的自然作息。目前在年輕人中普遍流行的熬夜、爆肝,也許和生物節律的紊亂或延后有關。這種生物鐘紊亂,目前已經比較明確和視覺相關——而且是以一種神奇的方式。
生物鐘紊亂在日常生活中非常普遍,并且受到了大家的關注。許多商家也都利用這個問題,營銷它們的產品(例如各種“防藍光”產品)。但是如果詢問商家客服(由于客服通常并非神經科學專業人士),得到的回答總覺得不夠信服。
鑒于上述原因,以及這個信號通路的神奇性質,我將專文講解這一話題,敬請期待。
上丘
上圖中“Sup.Coll.”指的就是上丘。
完整圖鏈接:https://www.neurosurgicalatlas.com/neuroanatomy/lateral-view-of-the-midbrain-and-pons
上丘是和眼動相關的重要腦區,參與到由光、聲音等外界因素引起的眼動反射活動。眼動也是近期神經科學領域的熱點研究對象之一,因為越來越多的跡象表明:眼動可以幫助我們高效檢測“紛繁復雜、變幻莫測”的外部世界;眼動的模式,直接影響到人們提取視覺信息的效果,還和自閉癥、社交障礙等疾病有一些聯系。
我之后計劃通過題為《漢字的序順影不響閱讀?眼動和視覺信息整合》的文章,詳細聊一聊它。
我們把目光拉回到視覺系統的“第一通路”。視覺信息從外側膝狀體傳入初級視覺皮層之后,在這里進行了更加細致的特征提取和分類整合。初級視覺皮層可以檢測圖像的朝向信息、顏色、運動方向、視野中位置等信息,已經比視網膜和外側膝狀體更進一步了。目前初級視覺皮層也是研究的熱點腦區,它被認為和“視覺體驗”直接相關。我將在之后專門撰文講解初級視覺皮層和“視覺體驗”的關系。
初級視覺皮層將視覺信息分發給多個更高級的腦區,由這些高級腦區進行分工細致的后續處理。這些高級腦區又會和更多腦區聯系,從而影響人的行為和思想。
到此為止,我們就梳理完成了視覺信號進入大腦的全過程。
但這并不是終點。其實,大腦里負責視覺的各個區域之間,包括從高級到低級,都存在著豐富而復雜的信號反饋。如果把視覺信號傳入大腦的過程,視作“自下而上”的匯報,那么高級皮層的反饋,就像是“自上而下”的指示。
視覺信息流就在這樣“上上下下”的反復傳遞中,建立起我們用視覺認知外部世界的基本功能。
在這個復雜而有序的過程中,原始的外界輸入信號其實已經被重組、扭曲得不成樣子了。
我們下一篇文章,就簡單聊一聊:原始的視覺輸入圖像,在腦子里被如何重組和扭曲。敬請期待!
2020.4.8
于復旦大學生命科學學院
(四)視覺信號在大腦中被重組、扭曲全過程!
如果從事視覺神經生物學研究久一點,就會發現:愈是深入進去,就要面臨愈發抽象的現象。
例如,我們的眼睛日常看到的畫面,似乎是一個平面(其實準確來說是一個球面,球心在眼睛這里)。這個平面基本符合歐幾里得幾何學,在各個方向上都是均勻的。
但是,在大腦內部,我們眼前的視野是如何表征的呢?換句話說,假設我們可以打開人的大腦,直接觀察和視覺相關的腦區活動,我們眼前的世界在大腦里的投影,長什么樣子?
這里就要提及一個專業術語:視網膜拓撲投射圖。
簡單來說,視網膜拓撲投射圖就是指:視野在特定大腦區域里被扭曲成的樣子。
在科學研究中,我們近似把視野空間當作一個平面圖像,同時也把視網膜接受的視覺信號,看成是視野的投影(由于光線經過了“晶狀體”這個凸透鏡,視網膜圖像是視野圖像的翻轉)。
視網膜上的平面圖像,在逐級上傳到大腦的過程中,會經歷多次扭曲和重組。我們接下來一個一個說:
視交叉“拆分”視野
如果你還記得上一篇文章(視覺信號如何傳入大腦?)里所講的“視交叉”的作用,那么你就知道,視覺信息經過視交叉以后,每側大腦都只獲得了半側視野的信息。因此視網膜圖像到達視交叉之后,就被“砍掉”了一半,只剩下左側或右側的半張圖像(見上圖)。
外側膝狀體“重組”視野
經過視交叉削減后的半張視網膜圖像,到達外側膝狀體之后,會被用一種神奇的方式,重新組織起來。
外側膝狀體很有意思,它是分層的結構,每一層的細胞都有不同的作用。人的外側膝狀體分為六層,從下到上分別命名為第1、2、3、4、5、6層。外側膝狀體的神奇之處在于:
同側眼睛發來的信號,由2、3、5層細胞接收;對側眼睛發來的信號,由1、4、6層細胞接收。
下圖是一張形象的示意圖,請注意雙眼信號被拆分的情況:
換句話說,如果我用一個電極,從上往下扎下去,按照順序,我會先記錄到對側眼傳來的信號,然后是同側眼,然后又是對側眼、同側眼、同側眼、對側眼。
這里大家要記住,不論是對側眼還是同側眼,傳來的都只是對側視野的圖像。這里容易搞混,需要多多體會一下。
接下來還有更神奇的:
外側膝狀體的每一層,都與對側視野相應的半個視網膜之間,形成了對應的視網膜投射圖。換句話說,視網膜圖像上相鄰的點,在外側膝狀體里形成的圖像上,依然是相鄰的。當一根電極從外側膝狀體的某一層穿到另一層時,記錄到的信號對應的視野位置基本不變,但是來源卻從一只眼變成了另一只眼。
不過,外側膝狀體的形狀比較扭曲,所以雖然視網膜圖像和外膝體圖像上的點是空間位置一一對應的,但是圖像整體發生了扭曲變形。所以,科學家們在這種投射關系的名稱 里加入了兩個字——“拓撲”。
所謂拓撲,就是指:只考慮物體間的位置關系而不考慮它們的形狀和大小。
如此一來,想必你能理解上面提到的“視網膜拓撲投射圖”的意思了。
那么接下來,我們就正式看一看:我們看到的世界,在大腦里被扭曲成什么樣子?
視野在大腦內部的樣子
下圖中,左側是視野范圍(坐標使用“視角”,單位是“度”),右側是猴外側膝狀體的立體圖。顏色表示不同視野區域在外側膝狀體中的對應位置。這樣,視野在外膝體中被扭曲的情況就一目了然了!(再次感謝 @高林夏 同學精湛的繪圖技術)
參考此文獻數據所作:Malpeli, & Joseph, G. . (1975). The representation of the visual field in the lateral geniculate nucleus of macaca mulatta. Journal of Comparative Neurology, 161(4), 569.
初級視覺皮層也有視網膜拓撲投射圖,像這個樣子:
參考此文獻數據所作:Larsson, J. , & Heeger, D. J. . (2006). Two retinotopic visual areas in human lateral occipital cortex. Journal of Neuroscience, 26(51), 13128-13142.
視網膜拓撲投射圖是初級視覺腦區的非常基本的性質,它說明:在比較初級的視覺信息處理階段,大腦是很在意視野里每一個點的具體位置的。
而且,從上面的兩張圖中可以得出一個重要的規律:越靠近視野中央的位置,視覺系統分配了越多的資源(腦區面積)。
這是一個嚴重“貧富不均”的設定,就好比一個位于權力中央的人,獲得了幾倍甚至幾十倍于權力邊緣人群的資源。但這種結構,能夠極大提升視覺系統處理中央視野信息的能力和效率,再配合高速的眼動和有效的“腦補”,就可以很好地完成“用視覺認識世界”的基本任務。
其實“視覺系統的策略”是一個很重要的話題,我在以后會專門撰文來講解。
言歸正傳。視網膜拓撲投射圖在科學研究中還有一個重要用途,那就是:只要知道物體出現在視野的哪個位置,就能大致計算出它激活了哪個位置的腦區。反過來也一樣:如果在特定位置的腦區記錄到了神經細胞激活,就能反推回去,判斷物體在視野中的位置。甚至還可以建立起外側膝狀體和初級視覺皮層之間的圖像對應關系。
例如:2017年5月24日發表在《Journal of Neuroscience》的文章《Intracellular, In Vivo, Dynamics of Thalamocortical Synapses in Visual Cortex》中,研究者巧妙設計了實驗,從茫茫大海一般的神經細胞群體中,找到了外側膝狀體某個特定細胞直接連接到的初級視覺皮層細胞。
來源文獻:Sedigh-Sarvestani, M., Vigeland, L., Fernandez-Lamo, I., Taylor, M. M., Palmer, L. A., & Contreras, D. (2017). Intracellular, in vivo, dynamics of thalamocortical synapses in visual cortex. Journal of Neuroscience, 37(21), 5250-5262.
他們的做法是:首先通過學界經典方法,在實驗動物的外側膝狀體扎入一根電極,找到其中某個細胞負責的視野區域,然后查閱文獻,找到負責同一視野區域的皮層細胞所在位置,在該處扎入另一個電極。同時記錄兩根電極的信號,通過數據分析處理,找到確切的配對細胞。
讓我們回到一開始的問題:假設我們可以打開人的大腦,直接觀察和視覺相關的腦區活動,我們眼前的世界在大腦里的投影,長什么樣子?
現在的你,已經心里有數了吧!
下一篇文章,我們將真正探討“視覺信息處理”在大腦中的細節(先講外側膝狀體),敬請期待!
2020.4.13
于復旦大學生命科學學院
(五)視覺信號在大腦中的第一站:外側膝狀體
在上一篇文章(視覺信號在大腦中被重組、扭曲全過程!)中,我們一起欣賞了視覺輸入圖像在大腦的各個層次扭曲、重組的現象,初窺了大腦進行視覺信息處理的復雜程度。這次,我們將連續通過三篇文章,從底層到高層,逐漸深入視覺系統最為關鍵的領域,也是最迷人、最令人捉摸不透的領域。
這三篇文章分別是:
- 《視覺信號在大腦中的第一站:外側膝狀體》
- 《視覺信號在大腦中的第二站:初級視覺皮層》
- 《視覺信號在大腦中的第三站:高級視覺皮層們》
在這三篇文章中,我有幾個目標和野心:
- 盡可能全面而簡潔地描述目前人類對視覺系統的認識
- 用最前沿的科研成果,反駁目前人工神經網絡一再重蹈的誤區
- 從神經科學角度,提出一些對“視覺認知”乃至“人工神經網絡”的思考與展望
話不多說,我們進入視覺信號在大腦中的第一站——外側膝狀體(Lateral Geniculate Nucleus)。
來源文獻:Malpeli, & Joseph, G. . (1975). The representation of the visual field in the lateral geniculate nucleus of macaca mulatta. Journal of Comparative Neurology, 161(4), 569.
外側膝狀體是位于丘腦的一個小小的神經核團,直徑只有幾個毫米。它叫這個名字,是因為它位于“膝狀體”的外側。而“膝狀體”顧名思義,就是“長得像膝蓋的東西”(神經生物學的命名就是這么直截了當)。
放一張人的外側膝狀體切面圖(深色是細胞聚集位置,空白表示細胞密度低,即“層間區”):
來源文獻:Briggs, F. , & Usrey, W. M. . (2011). Corticogeniculate feedback and visual processing in the primate. Journal of Physiology, 589.
既然有“外側膝狀體”,那當然也有“內側膝狀體”——內側膝狀體是我們聽覺信號的中繼站,而外側膝狀體是視覺信號的中繼站,不要搞混啦。
相信大家對“外側膝狀體”這個名詞并不陌生,因為在之前的幾篇文章中,我多次提及過它。
而我對這個豆子一般大小的神經核團(nucleus)有著很特殊的感情,那是因為:它是我人生中第一個科研課題的對象,是我真正進入視覺神經生物學研究一線之后,第一個需要從內而外仔細琢磨透徹的大腦區域。可以說,外側膝狀體是我研究視覺系統的起點,也是我最為熟悉的視覺腦區之一。
因此,我對于“向大家介紹外側膝狀體”這一任務,至少從專業性上,還是比較有信心的。
如果盡可能簡明地概括外側膝狀體的作用,那就是:
- 外側膝狀體是視覺信號傳入大腦皮層的重要中繼站
- 在外側膝狀體,一些視覺特征檢測功能開始“涌現”,并成為初級視覺皮層高度特化的特征檢測功能的“種子”
- 外側膝狀體通過與多個皮層下核團聯系,參與調節機體整體的認知狀態
如果身為讀者的你,正好從事人工神經網絡相關工作,或者從事神經生物學其他方向研究,那不妨請你把上述文字與之前在課本里、各種網上教程里學到的外側膝狀體的功能做個比較。也許你會發現一些區別。
目前似乎大多數人工神經網絡教材和版本較老的神經生物學教材,都忽略了外側膝狀體在視覺特征檢測中發揮的關鍵作用,把它看作視網膜神經節細胞的翻版——但實際上并非如此。
目前已經有大量的研究工作證實,外側膝狀體細胞可以編碼朝向信息(orientation)、運動方向信息(direction)和速度信息(speed),而且極有可能是皮層類似功能的“種子”(具體內容很快就會講到)。
科研成果從一線工作者向其他學科領域傳播是有滯后性的,而且不同學科吸收神經科學成果的時候,也會有所偏好。但這并不是忽視科學事實的理由,我們在具體應用建模時可以按需簡化,但至少應當明晰科學事實。
言歸正傳。我們來聊一聊:外側膝狀體是怎樣發揮上述的3條關鍵作用的?
視覺信號中繼站
首先,讓我們復習一下外側膝狀體在視覺系統中的位置:
視覺信號沿著視神經,從視網膜出發,經過視交叉的拆分重組后,到達雙側大腦內部的外側膝狀體。
外側膝狀體的內部是分層的結構,每一層都只接受一只眼睛的信號輸入。(上一篇文章《視覺信號在大腦中被重組、扭曲全過程!》已經初步講解過)但對于一個外側膝狀體而言,不論接受哪只眼睛的信號,都是來自對側視野的。例如:左腦內的外側膝狀體,只接受雙眼傳來的右側視野的信息;右腦內的外側膝狀體,只接受雙眼傳來的左側視野的信息。(見下圖)
如果你還記得“視網膜拓撲投射圖”這個概念,那么理解外側膝狀體的視覺信息整合方式就比較容易(如果忘記了,請回到上一篇文章再理解一下)。
讓我們做一個形象的比喻:
我們把外側膝狀體的每一層,都當作一張世界地圖,來自左眼的信號,我們當作是用紅色筆畫的;來自右眼的信號,我們當作是用藍色筆畫的。
接下來我們只討論左腦外側膝狀體(右腦的可以類推)。
人腦的外側膝狀體有6層,相當于把6張世界地圖疊在一起。要注意的是,從下往上第1、4、6層是藍色筆畫的(來自對側眼,即右眼),第2、3、5層是紅色筆畫的(來自同側眼,即左眼)。
現在我要把這六張地圖的信息整合起來,交給初級視覺皮層,需要怎么做呢?
外側膝狀體的做法是:拿出一個打孔器,從“新西蘭”的正上方按下去,把6層地圖的“新西蘭”一次性取出來,打包在一起,貼上一個標簽“新西蘭”。
隨后,外側膝狀體把地圖的每個角落,都按照相同的方法打孔、打包、貼上標簽,并且按照空間相對位置來擺放。隨后,這些保留原有空間相對位置關系,并且被打包好的地圖碎片,被一次性交給了初級視覺皮層。
初級視覺皮層拿到了這些包裝好的地圖碎片以后,把它們按照原有的空間相對位置關系擺好,但只從每個包裹里抽取1個碎片,作為包裹里6個碎片的代表。這樣,初級視覺皮層就獲得了一張新的世界地圖。按照同樣的方法,它從右腦的外側膝狀體也獲得了一張世界地圖。
在上面的例子里,“世界地圖”對應的就是視野;打孔器的大小,對應的是“感受野”的大小,也就是每個細胞負責的視野區域。其實初級視覺皮層在抽取地圖碎片的時候,并非隨機亂抽(事實上也并不是真的“抽取”——這只是為了便于理解而使用的比喻),而是遵守了一個神奇的規律,我們在下一篇文章會專門講解。
視覺特征檢測功能涌現
外側膝狀體已經可以初步檢測視覺圖形的空間朝向信息(orientation,學界也翻譯為“方位”)、運動方向(direction)和運動速度信息(speed)了。這相比于視網膜,已經前進了一大步,因為在比較高級的哺乳動物中,視網膜絕大多數細胞是不具備上述功能的。
至于為什么會突然出現這樣的功能,學界數十年來一直存在爭論。目前已經有實驗數據證明的結論有幾點:
- 外側膝狀體細胞能夠檢測空間朝向信息,可能是因為它的細胞樹突野的分布模式是拉長的、有朝向的。
- 大約有70%的外側膝狀體細胞具有空間朝向檢測能力,并且偏好相近朝向的細胞,在空間上也聚集成團,已經具有了一定的功能組織模式。
- 大約有1/3的外側膝狀體細胞具有運動方向檢測能力,并且這種能力不是來自于皮層,而是來源于皮層下的早期發育結構。
因此,外側膝狀體不能僅僅被看作是神經節細胞的翻版,而應當被認為是視覺信息在皮層下的重要處理站,甚至有可能為初級視覺皮層的特征檢測功能提供了最初的“種子”。
來源文獻:Xu, X., Ichida, J., Shostak, Y., Bonds, A. B., & Casagrande, V. A. (2002). Are primate lateral geniculate nucleus (LGN) cells really sensitive to orientation or direction?. Visual neuroscience, 19(1), 97-108.
圖中箭頭表示:大于該值(0.08)則為有“顯著敏感性”
在這里,需要提到一位中國的神經科學家——復旦大學的壽天德教授。他在20世紀80、90年代針對外側膝狀體的研究工作,改變了學界對外側膝狀體的簡單認識,修正了視覺神經生物學奠基者、諾貝爾獎獲得者Hubel和Wissel的理論,具有國際影響。
大細胞和小細胞兩個通道
外側膝狀體內部分為6層,其中第1、2層和3、4、5、6層分屬兩類——大細胞層和小細胞層。所謂大細胞,指的是這類細胞的感受野尺寸比較大。同理,小細胞的感受野比較小。
大細胞和小細胞分別對不同類型的視覺信號敏感——大細胞喜歡“運動信息”,對運動的方向、速度信息很敏感,但是對物體的精細結構不敏感;小細胞喜歡“形狀信息”,對物體的精細結構敏感,但對運動信息不敏感。
這樣一來,大、小細胞就將輸入的視覺信號分為兩類,各自打包向皮層傳輸,從而實現了“雙通道并行”的模式。這種并行模式,使得后續視覺皮層檢測多種視覺特征信息變得更加容易。
參與調節機體認知狀態
外側膝狀體和許多皮層下的神經核團具有聯系,這些神經核團,有的和警覺態相關(背側中縫核、藍斑),有的和情緒相關(杏仁核),有的和眼動相關(上丘)。它們都參與了機體的認知狀態的整體調節,影響到視覺信息底層輸入與篩選的程度。
例如,假如你此刻昏昏沉沉,那么你有很大概率忽視了身邊飄過的一根絨毛。但如果你喝了咖啡,又剛吵過架,那么眼前任何蛛絲馬跡都逃不過你的火眼金睛。機體整體的認知狀態,可以影響到比較底層的神經核團,從而在源頭控制視覺信息的輸入。
關于這個話題,還可以引申開去,不僅和我們的日常行為息息相關,還能夠為人工神經網絡的設計提供一點思路。限于篇幅,我將在未來專門撰文介紹。
讓我們回到最初的地方,重溫一下外側膝狀體的三個知識點:
- 外側膝狀體是視覺信號傳入大腦皮層的重要中繼站
- 在外側膝狀體,一些視覺特征檢測功能開始“涌現”,并成為初級視覺皮層高度特化的特征檢測功能的“種子”
- 外側膝狀體通過與多個皮層下核團聯系,參與調節機體整體的認知狀態
下一篇文章,我們將要講解視覺系統的“大明星”——初級視覺皮層。它是理解“視覺”的關鍵,也是半個多世紀以來,無數神經科學家奮力挖掘的寶藏。
可以說,在神經科學的發展歷史中,對初級視覺皮層的研究已經成為了經典的范例——每一位打算入門神經科學領域的年輕學生(無論將來從事什么研究),都繞不開它。
敬請期待!
2020.4.17
于復旦大學
(六)“虛擬視覺”第一步:理解初級視覺皮層
在上一篇文章中(視覺信號在大腦中的第一站:外側膝狀體),我們比較詳細介紹了外側膝狀體的一些情況。現在,我們要真正見到視覺系統的“大明星”——初級視覺皮層(primary visual cortex,也叫V1)了!
來源文獻:Tootell, R. B., Hadjikhani, N. K., Vanduffel, W., Liu, A. K., Mendola, J. D., Sereno, M. I., & Dale, A. M. (1998). Functional analysis of primary visual cortex (V1) in humans. Proceedings of the National Academy of Sciences, 95(3), 811-817.
圖中V1即指初級視覺皮層
“初級視覺皮層是理解視覺的關鍵”這句話,我認為并不過分。自從視覺研究的奠基人之二——Hubel和Wissel——在20世紀50-60年代系統研究了初級視覺皮層的信息處理機制以來,初級視覺皮層就一直為全世界的神經科學家們提供源源不斷的新知識——這一境況持續了半個多世紀,而人類對它的認識似乎還遠未終結,可見它蘊含的奧秘是多么豐富!
同時,初級視覺皮層的早期研究,大大促進了人類對大腦工作機制的理解。例如“皮層功能柱”、“大腦發育關鍵期”、“視覺特征提取”、“信號的分級處理”等概念和思想,在初級視覺皮層的研究中不斷被提及,也影響到神經科學領域的其他研究之中。以至于數十年來,每一位立志投身于神經生物學研究的年輕人,都要在課堂與教科書中,一遍遍重溫初級視覺皮層的早期研究史。
不過,本篇文章的目的并非介紹科學史,而是科普“人類目前怎樣理解初級視覺皮層的功能”。為了便于大家理解接下來的內容,我們需要以幾個基本概念為線索,逐漸揭開初級視覺皮層的面紗:
感受野(receptive field)
簡單來講,感受野就是一個感覺細胞能夠感受到的原始刺激輸入的區域總和。
例如,一個皮膚觸覺細胞的感受野,就是它負責的皮膚表面區域之和;一個視覺細胞的感受野,就是它負責的視野區域之和。形象來講,視覺細胞的感受野,就是這個細胞能“看到”的視野區域。視覺細胞只對感受野內的視覺刺激有明顯反應,而感受野以外的區域,無法引起這個細胞的明顯反應。
大部分視覺細胞的感受野都是有結構的——感受野內不同的區域,對光的反應有所區別。對于比較低層級的視覺細胞來說,“細胞感受野的形狀”和“細胞檢測視覺特征的能力”息息相關。
大腦皮層的分層結構
圖片來源:《神經科學原理》第5版
大腦皮層一共分為6層,從淺到深依次編號為第1、2、3、4、5、6層。每一層的功能都有所區別。
通常來講,第1層主要是神經纖維網,細胞密度比較低,主要接收其他皮層區域自上而下的“反饋”連接。
第2、3層細胞密度比較高,主要參與向大腦皮層各區域的、由低向高的“前饋”連接。
第4層主要接收大腦其他區域(除了皮層,也包括皮層下區域,如丘腦、下丘腦、中腦、基底神經節等)投射上來的信號。
第5層除了參與皮層各區域之間的遠程連接以外,也向皮層下區域投射信號。
第6層既可以接收其他皮層區域的“反饋”,也可以向丘腦發送“反饋”信號。
不過不同的皮層區域功能差別較大,各層的分工也有一些區別,我們在這里主要關注初級視覺皮層。
對于初級視覺皮層來說,視覺信號在其中的傳遞大致遵守如下順序(簡略版):
給光、撤光反應(ON/OFF response)
來源網址:https://gifer.com/en/H90l
所謂“給光”(ON),就是用光照亮某個區域;“撤光”(OFF)就是反過來,讓某個區域變暗。
如果用一束光照亮一個細胞感受野,導致這個細胞被激活,我們就稱這個細胞是“給光細胞”。如果讓一個細胞的感受野中央區域變暗,導致這個細胞被激活,我們就稱這個細胞是“撤光細胞”。(對于感受野有中心-周邊結構的細胞來說,還可以分得更細:比如“給光中心細胞”、“撤光中心細胞”等等)
簡單來說,“給光細胞”(ON細胞)更喜歡光明,而“撤光細胞”(OFF細胞)更喜歡黑暗。
這個知識點,在我們后續理解初級視覺皮層的功能組織方式的時候至關重要。
方位選擇性(orientation selectivity)
所謂方位,也叫做“空間朝向”(orientation),指的是一條短線的傾斜角度(范圍是0-180°,見下圖)。
初級視覺皮層細胞有一種重要的性質,就是“方位選擇性”。換句話說,絕大部分初級視覺皮層細胞,都有一個“最喜歡的方位”(preferred orientation,中文習慣翻譯成“最優方位”)。
給一個初級視覺皮層細胞看不同方位的短棒,當短棒的方位等于這個細胞的最優方位時,細胞的反應就達到最強。如果短棒的方位逐漸偏離最優方位,細胞的反應就越來越弱。如果短棒的方位和最優方位垂直,那么此時細胞的反應就達到最低點。
這樣一來,我們就可以通過觀察細胞的反應強弱變化,來得知這個細胞最喜歡哪個方位了。
初級視覺皮層細胞的上述性質,被稱為“方位選擇性”。類似的,還存在“運動方向選擇性”、“空間頻率/時間頻率選擇性”(很快會講到)、“顏色選擇性”等等。
這些選擇性,本質上使得初級視覺皮層具備了檢測并編碼各種視覺特征的能力。
“正弦光柵”與空間頻率、時間頻率(sinusoidal grating、spatial frequency、temporal frequency)
正弦光柵示意圖
“空間頻率”和“時間頻率”是用來描述“視覺圖像在空間上和時間上變化快慢”的定量指標。
根據傅里葉分析的思想,任何一個連續變化的波形,都可以分解為正弦/余弦函數疊加的形式。因此,任何一種復雜的亮度變化過程,也都可以分解為最最基本的正弦/余弦結構的疊加。
所以,視覺科學家們把“正弦光柵”作為常用的簡單二維圖形刺激,來研究最基本的視覺信息處理機制。
“正弦光柵”就是一個亮度按照正弦波周期性變化的圖像。把“正弦光柵”勻速向一個方向移動,每一個點的亮度也會按照正弦周期性變化,這樣子就得到了在空間上和時間上都符合正弦函數變化的二維圖像。(正弦和余弦可以通過平移來互相轉換,學界習慣用“正弦”來稱呼這樣的視覺圖像)
以移動的正弦光柵為例,“空間頻率”就是單位距離內的正弦周期數量(單位距離通常取1°視角);而“時間頻率”是對于畫面中某一個點而言,一秒之內,這個點的亮度變化經過的正弦周期數量。
這樣一來,我們就可以用定量的方法,來分析復雜圖像最最基本的性質了。
眼優勢(ocular dominance)
人腦初級視覺皮層的細胞眼優勢分布圖。黑色/非黑色條帶顯示了不同眼睛支配的視覺皮層
來源文獻:Horton, J. C. , & Hedley-Whyte, E. T. . (1984). Mapping of cytochrome oxidase patches and ocular dominance columns in human visual cortex. Philosophical Transactions of the Royal Society B Biological Sciences, 304(1119), 255-272.
如果你還記得雙眼的信息是如何傳入外側膝狀體,又是如何由外側膝狀體整合傳入初級視覺皮層的(詳情見上一篇文章:視覺信號在大腦中的第一站:外側膝狀體),那么就知道:在上一篇文章的“世界地圖”例子最后,留了一個未解答的問題——初級視覺皮層在抽取地圖碎片的時候,并非隨機亂抽,而是遵守了一個神奇的規律。
這個規律導致,每個初級視覺皮層細胞,要么更喜歡左眼的信號(左眼優勢),要么更喜歡右眼的信號(右眼優勢)。這也產生了初級視覺皮層的另一個性質:眼優勢。靈長類動物(包括人類)的初級視覺皮層細胞大都是具有眼優勢性質的(見上圖),而貓科動物沒有。小鼠這種眼睛長在頭兩側的動物,也具有眼優勢性質。
皮層功能柱(cortical functional column)
我們大腦的結構遵循了一個重要而深刻的規律:功能相似的細胞傾向于聚集在一起。
換句話說,就是“物以類聚,人以群分”。
在初級視覺皮層中,“最優方位”相似的細胞,往往聚集在一起形成一個“小社區”,這個社區覆蓋了管轄范圍以內皮層的每一層。換句話說,一個細胞只要在這個社區之內,不論它在第幾層,它的最優方位都和社區內其他細胞相差不多。
如果用科學的方法來描述,就好比用一根電極從皮層表面垂直扎下去,沿途遇到的每一個細胞,都喜好相同的“方位”——在一個“社區”之內,細胞們在深度上是同質的。
這個“社區”實際上像是一個6層的樓房,初級視覺皮層還有許許多多類似的樓房,有的樓房住“喜歡0°方位的細胞”,有的樓房住“喜歡90°方位的細胞”,以此類推,最終覆蓋0-180°的所有方位。
神經科學家們形象地把這種聚集形式稱為“方位功能柱”,因為它們看起來就像是把皮層切成了很多個柱子一樣(見下圖)。
圖片來源:《神經科學原理》第5版
除了方位以外,初級視覺皮層還有“運動方向柱”、“空間頻率柱”等等。事實上,“功能柱”的組織方式在其他皮層中也普遍存在。例如在聽覺皮層中,就有“頻率柱”——喜好相同聲音頻率的細胞也聚集在一起,形成柱狀結構,整個皮層由許多個喜好不同頻率的功能柱組成(見下圖)。
貓的初級聽覺皮層的聲音頻率柱
來源文獻:Carrasco, A., Brown, T. A., & Lomber, S. G. (2014). Spectral and Temporal Acoustic Features Modulate Response Irregularities within Primary Auditory Cortex Columns. PloS one, 9(12).
“皮層功能柱”的結構,最初就是在初級視覺皮層中被發現的。因此早期對視覺系統的研究,極大推動了人們對整個大腦的基本組織規律的認識。而發現“皮層功能柱”也成為了神經科學史上的一個重大事件。
沒想到只是“知識準備”,就已經寫了這么長(由此可見初級視覺皮層的內容之豐富)。限于篇幅,我決定將初級視覺皮層的內容分為兩篇來講——上篇是下篇的知識儲備。
在下篇中,我們將展開對初級視覺皮層“視覺信號處理機制”以及“功能組織模式”的討論——這兩者對于理解“視覺”在我們頭腦內的“表征方式”至關重要。
如果有朝一日人類徹底理解了它們,就可以在頭腦中創造真正的“虛擬視覺”。
2020.4.22
于復旦大學
(七)視覺信號在大腦中的第三站:高級視覺皮層們
未完待續!
最后更新于:2020.4.22
總結
以上是生活随笔為你收集整理的视觉系统:人类最重要的感觉的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 三谈 钉钉、企微、飞书 的不同:优势即劣
- 下一篇: UEFI和Legacy的区别与系统支持