當前位置：首頁 >

来一场蛋白和小分子的风花雪月

發(fā)布時間：2025/3/15 65 豆豆

生活随笔收集整理的這篇文章主要介紹了来一场蛋白和小分子的风花雪月小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

分子對接(Molecular Docking)理論

所謂分子對接就是兩個或多個分子之間通過幾何匹配和能量匹配相互識別找到最佳匹配模式的過程。分子對接對酶學研究和藥物設(shè)計中有重要的應(yīng)用意義。

分子對接計算是在受體活性位點區(qū)域通過空間結(jié)構(gòu)互補和能量最小化原則來搜尋配體與受體是否能產(chǎn)生相互作用以及它們之間的最佳結(jié)合模式。分子對接的思想起源于Fisher E的”鑰匙和鎖模型”，主要強調(diào)的是空間形狀的匹配。但配體和受體的識別要比這個模型更加復(fù)雜。首先，配體和受體在對接過程中會由于相互適應(yīng)而產(chǎn)生構(gòu)象的變化。其次，分子對接還要求能量匹配，對接過程中結(jié)合自由能的變化決定了兩個分子是否能夠結(jié)合以及結(jié)合的強度。

1958年D.E.Koshland提出分子識別過程中的誘導(dǎo)契合概念，受體分子活性中心的結(jié)構(gòu)原本并非與底物完全吻合，但其是柔軟和可塑的。當配體與受體相遇時，可誘導(dǎo)受體構(gòu)象發(fā)生相應(yīng)的變化，從而便于他們的結(jié)合進而引起相應(yīng)的反應(yīng)。

分子對接方法根據(jù)不同的簡化程度分為三類：剛性對接、半柔性對接和柔性對接。剛性對接指在對接過程中，受體和配體的構(gòu)象不發(fā)生變化，適合研究比較大的體系如蛋白-蛋白之間以及蛋白-核酸之間，計算簡單，主要考慮對象之間的契合程度。半柔性對接常用于小分子和大分子的對接，在對接過程中，小分子的構(gòu)象可以在一定范圍內(nèi)變化，但大分子是剛性的。這樣既可以在一定程度上考察柔性的影響，又能保持較高的計算效率。在藥物設(shè)計和虛擬篩選過程中一般采用半柔性的分子對接方法。柔性對接方法一般用于精確研究分子之間的識別情況，由于允許對接體系的構(gòu)象變化，可以提高對接準確性但耗時較長。

分子對接的目的是找到底物分子和受體分子最佳結(jié)合位置及其結(jié)合強度，最終可以獲得配體和受體的結(jié)合構(gòu)象，但這樣的構(gòu)象可以有很多，一般認為自由能最小的構(gòu)象存在的概率最高。搜尋最佳構(gòu)象就要用到構(gòu)象搜索方法，常用的有系統(tǒng)搜索法和非系統(tǒng)搜索法。系統(tǒng)搜索法通過改變每個扭轉(zhuǎn)角評估所有可能的結(jié)合構(gòu)象，進而選取能量最低的。這一方法計算量非常大。因此通常使用非系統(tǒng)搜索法來尋找能量較低構(gòu)象，常用方法有：分子動力學方法、隨機搜索、遺傳算法、距離幾何算法等。隨機搜索又包括完全隨機算法、蒙特卡羅法和模擬退火法等。

AutoDock Vina是The Scripp Research Institute的Olson科研小組開發(fā)的分子對接軟件包，使用拉馬克遺傳算法提高效率。軟件把遺傳算法和局部搜索結(jié)合在一起，遺傳算法用于全局搜索，而局部搜索用于能量優(yōu)化。為了加快計算速度，AutoDock Vina采用格點(grid)計算。首先在受體活性氨基酸附近劃定一個長方體區(qū)域作為搜索空間，掃描不同類型的原子計算格點能量，在搜索空間內(nèi)，調(diào)整配體的構(gòu)象、位置和方向，進而評分、排序獲得能量最低的構(gòu)象作為輸出結(jié)果。

對范德華相互作用的計算：每個格點上保存的范德華能量的值的數(shù)目與要對接的配體上的原子類型數(shù)目相同。如果一個配體中含有C、H、O三種原子類型，那么每個葛店需要用單個探針原子與來計算其與受體之間的范德華相互作用值。當配體與受體進行分子對接時，配體中某個原子和受體之間的相互作用能通過周圍8個格點上的這種原子類型為探針的格點值用內(nèi)插法得到。

靜電相互作用的計算采用靜電勢格點。當配體與受體對接時，某個原子和受體之間的靜電相互作用能通過周圍格點上靜電勢以及原子上的部分電荷計算得到。

蛋白和小分子可視化

例子文件是一個分辨率為2艾的X-射線衍射晶體結(jié)構(gòu)(PDB ID: 1HSG)，其為HIV-1蛋白酶與藥物茚地那韋(indinavir)結(jié)合在一起的構(gòu)象。軟件PyMOL用來觀察HIV-蛋白酶、結(jié)合位點和藥物分子的結(jié)構(gòu)。

顯示蛋白結(jié)構(gòu)并做樣式處理

下載HIV-1蛋白酶的PDB結(jié)構(gòu)(https://files.rcsb.org/download/1HSG.pdb)，存儲到一個不含中文和空格的目錄下。

啟動PyMOL，依次點選File-Open-1hsg.pdb導(dǎo)入PDB文件，會看到如下界面

首先在右側(cè)的對象控制面板，依次點選行all的H列-Hide: everything(如左圖所示)，然后浩瀚無際的沒有月亮的夜空出現(xiàn)在我們面前。

在右側(cè)的對象控制面板，依次點選行1hsg的S列-Show: cartoon，然后點選C列-By chain顯色，這時可以看到如右圖所示的同源二聚體。

左圖展示對象控制面板，右圖展示蛋白同源二聚體

顯示與蛋白結(jié)合的小分子化合物和水分子

從蛋白結(jié)構(gòu)的PDB文件(PDB文件格式解析見后面)或PDB官網(wǎng)的信息(如下圖所示)可以看到，1hsg結(jié)構(gòu)中包含配體藥物indinavir，其殘基的名字為MK1。

在PyMOL的命令行處輸入PyMOL> select indinavir, resn MK1，回車，會看到如下畫面變化。

左圖展示輸入的命令和輸入命令前的結(jié)構(gòu)圖，右圖展示輸入命令后的結(jié)構(gòu)圖，藥物分子的結(jié)構(gòu)呈被選定狀態(tài)(紅色空心塊)。

在右側(cè)的對象控制面板，依次點選行indinavir的S列-Show stick，再點選C列選擇一種不同的顏色。在屏幕無圖處點擊鼠標，取消小分子藥物的選擇狀態(tài)。這時可以清晰的看到小分子的結(jié)構(gòu)和空間位置(如下左圖)，隨意拖動鼠標旋轉(zhuǎn)或放大查看藥物分子與蛋白的結(jié)合方式。PyMOL鼠標操作：按住左鍵移動旋轉(zhuǎn)，按住右鍵移動放大，按住中鍵移動，觀察結(jié)合位點所在的位置；滾動滾輪調(diào)節(jié)景深，化學結(jié)構(gòu)會以溶解形式出現(xiàn)。

顯示水分子。水分子的殘基名字為HOH，運行命令PyMOL> select H2O, resn HOH調(diào)出水分子。然后點選S-Show spheres,?C-red。再運行PyMOL> set sphere_scale, 0.2設(shè)置水球的大小。

左圖小分子的結(jié)構(gòu)圖及其與蛋白的結(jié)合位點，右圖展示蛋白、小分子、水分子(紅色圓球)的空間構(gòu)象。

如果要存儲結(jié)果，則在命令行輸入png E:/docking/1shg.png保存當前結(jié)果。

準備docking需要的受體(蛋白)和配體(化合物)

Docking算法需要每個原子帶有電荷并且需要標記原子的屬性。這些信息通常未包含在PDB文件中。我們需要在對蛋白和小分子的PDB文件預(yù)處理，生成PDBQT文件同時包含以上信息和PDB文件中的原子坐標信息。進一步地對于“柔性配體docking”，我們還需要定義配體的柔性部分和剛性部分。所有這些都可以通過軟件AutoDock Tools (adt)來完成。

Docking algorithms require each atom to have a charge and an atom type that describes its properties. However, the PDB structure lacks these. So, we have to prep the protein and ligand files to include these values along with the atomic coordinates. Furthermore, for flexible ligand docking, we should also define ligand bonds that are rotatable. All this will be done in a tool called AutoDock Tools (adt).

準備受體蛋白

PDB文件(1hsg.pdb)中包含了蛋白、配體和水分子；首先提取出蛋白的坐標，即以關(guān)鍵字ATOM和TER開頭的行 (具體解釋和例子見后面PDB格式解析)存儲到文件1hsg_prot.pdb。

在windows下，我們可以手動選擇，或者利用Excel的篩選功能。
在Linux下，使用命令egrep "^(ATOM|TER)" 1hsg.pdb >1hsg_prot.pdb。

啟動AutoDockTools

windows直接雙擊圖標就可
Linux可以使用命令adt &

依次點選File-Read Molecule-1hsg_prot.pdb加載蛋白分子。

ADT中按住左鍵拖動旋轉(zhuǎn)分子結(jié)構(gòu)；點擊中鍵滾動縮放；按住右鍵移動晶體位置。

更改展示方式：依次點選Color-By Atom Type-All Geometries-OK。

加氫：晶體結(jié)構(gòu)中通常缺少氫原子的坐標 (因為氫原子電子少，且質(zhì)子核對電子吸引能力弱，因此很難定位，具體見http://www.uh.edu/~chembi/ChemSocRev_Jones_critical.pdf)。但是在docking過程中，氫原子尤其是極性氫原子對計算靜電作用是必須的。因此我們需要給蛋白加上氫原子，依次點選Edit-Hydrogen-Add-Polar only-OK(之所以選擇Polar only是因為vina的官方視頻里面是這么選擇的，后面我們會做一個測試，最終會證明這個地方是不是選極性氫對最終結(jié)果沒有影響)。這時氫原子會以白色短線形式出現(xiàn)。

增加氫原子前(左)和后(右)蛋白結(jié)構(gòu)顯示

存儲對蛋白的每個原子所做的修改和原子類型判斷：依次點選Grid-Macromolecule-Choose-1HSG_protein-Slect Molecule。ADT會彈出一個信息框包含程序所做的處理，比如合并非極性氫原子，計算原子局部電荷和判斷原子類型，并提示保存Save-1hsg_prot.pdbqt。打開文件，查看最后兩列，分別為每個原子的電量和類型 (詳見后面PDBQT文件格式解析)。

1hsg_prot.pdbqt為只加了極性氫的結(jié)果
1hsg_prot_all_h.pdbqt為加了所有氫的結(jié)果

這兩個文件只在原子電量部分有所不同，經(jīng)測試發(fā)現(xiàn)這兩種處理對docking的結(jié)果沒有影響，最后輸出的日志文件和結(jié)果文件相同。

在受體蛋白定義配體結(jié)合的3D搜索空間: 如果我們事先不知道結(jié)合位點，理論上可以定義一個長方體盒子包含整個蛋白或者隨便一個特定區(qū)域 (下文PDB文件解析中會提到PDB文件中有時會包含活性位點信息)。

依次點選Grid-Grid box將會在蛋白上畫出一個長方體，并且有一個彈出框。在彈出框中，拖拽刻度線查看長方體的變化，完成設(shè)置。在這個例子中，我們知道結(jié)合位點，就選取以其為中心的一個小空間。設(shè)置Spacing (angstrom)為1埃 (這實際是一個換算系數(shù), 相當于步長; 默認為0.375，是C-C單鍵長度的1/4，最大為1。spacing值與(各個維度上的點的數(shù)目+1)的乘機就是長方體Grid box的大小)。在我們調(diào)整的過程中，可以看到隨著這個數(shù)值的變大，立方體也被放大了。另外我們設(shè)置x,y,z center為16,25,4,number of points in (x,y,z)-dimension為30,30,30(最大為126，必須為偶數(shù)，AutoDock會自動再每一維再加一個點)。記下我們設(shè)置的這些點，下面會用到。

在刻度轉(zhuǎn)盤處點擊右鍵會彈出一個窗口，輸入數(shù)字回車即可設(shè)置GRID的中心坐標和大小。較大的number of points in (xyz)-dimension和較小的Spacing會增加搜索的精度，同時需要花費更多的計算時間。

設(shè)置受體的柔性殘基：在ADT中依次點選Flexible Residues-Input-Choose Macromolecule-1hsg_prot;?select-select from string-Residue: ARG8-Add-Dismiss, 8號ARG氨基酸殘基就被選中了。

再依次點選Flexible Residues-Choose Torsions in Currently Selected Residues將選擇的殘基標記為柔性殘基并設(shè)置可扭轉(zhuǎn)的數(shù)量。在分子顯示窗口中分別點擊兩個殘基上CA和CB原子之間的建，使之變?yōu)榉桥まD(zhuǎn)的（紫色顯示），這樣兩個殘基中的32個鍵中有6個是可扭轉(zhuǎn)的。這里設(shè)置配體的柔性殘基或者使CA-CB的鍵為剛性都是可選操作。放在教程中只是用來展示怎么操作的，無其它指導(dǎo)意義。

Flexible Residues-Output-Save Flexible PDBQT保存柔性殘基文件。Flexible Residues-Output-Save Rigid PDBQT保存柔性殘基文件。

關(guān)掉grid和刪除protein：Grid Options-File-Close w/out saving;?Edit-Delete-Delete Molecule-1hsg_prot-Continue。

準備配體

與蛋白結(jié)構(gòu)類似，配體的結(jié)構(gòu)也缺少氫原子，我們需要添加氫原子并且定義哪些鍵是可以旋轉(zhuǎn)的以用于柔性docking。

從PDB結(jié)構(gòu)中提取配體的原子位置。indinavir的配體殘基名字為MK1，以HETATM開頭的行表示非核心多聚體的成分 (heteroatoms)(具體見PDB文件格式解釋)。

Linux系統(tǒng)下，運行g(shù)rep "^HETATM.*MK1" 1hsg.pdb >indinavir.pdb
Windows系統(tǒng)下，直接拷貝到文件indinavir.pdb

將結(jié)構(gòu)讀入ADT；依次點選File-Read Molecule-indinavir.pdb;Color-By Atom Type-All Geometreies-OK。

晶體結(jié)構(gòu)中通常缺少氫原子 (因為氫原子電子少，且質(zhì)子核對電子吸引能力弱，因此很難定位，具體見http://www.uh.edu/~chembi/ChemSocRev_Jones_critical.pdf)。但是在docking過程中，氫原子，尤其是極性氫原子對計算靜電作用是必須的。因此我們需要給配體加上氫原子，Edit-Hydrogen-Add-Polar only-OK(之所以選擇Polar only是因為vina的官方視頻里面是這么選擇的)。這時氫原子會以白色短線形式出現(xiàn)。

增加氫原子前(左)和后(右)化合物結(jié)構(gòu)顯示

在ADT中定義此化合物為配體，以便ADT為其計算局部電荷(partial charges)和設(shè)置可旋轉(zhuǎn)配體鍵。依次點選Ligand-input-Choose-indinavir-Select Molecule for AutoDock4。這時會有一個彈出框顯示ADT所做的操作，包括合并非極性氫(只在添加了的情況下)、計算電荷電量和設(shè)置旋轉(zhuǎn)鍵。然后點選Ligand-Output-Save as PDBQT存儲結(jié)果。

indinavir.pdbqt為只加了極性氫的結(jié)果
indinavir_all_h.pdbqt為加了所以氫的結(jié)果

查看ADT檢測出的旋轉(zhuǎn)鍵，依次點選Ligand-Torsion Tree-Choose Torsions，可以看到Number of rotatable bonds=14/32。

準備docking配置文件

docking配置文件包含了輸入的受體(蛋白)、配體(化合物)和搜索參數(shù)的信息，為一個文本文件，名字任意，可以為conf.txt，內(nèi)容如下

receptor = 1hsg_prot.pdbqt ligand = indinavir.pdbqt num_modes = 50 out = dockingResult.pdbqt log = docking.log center_x = 16 center_y = 25 center_z = 4 size_x = 30 size_y = 30 size_z = 30 seed = 2009

receptor和ligand為輸入文件的名字，與conf.txt在同一目錄下; out為輸出文件的名字；log為輸出日志文件的名字。
centerhe和size定義搜索空間的位置和大小。
num_modes設(shè)置最多顯示的結(jié)合模型，鑒于只輸出符合能量值要求的結(jié)果，最后輸出的結(jié)合模型數(shù)量可能少于這一數(shù)值。
seed設(shè)置隨機數(shù)生成的種子，可以為任意整數(shù)。如果想重現(xiàn)之前的分析結(jié)果就需要使用相同的seed。

Docking 小分子化合物indinavir到HIV-1蛋白酶

使用AutoDock Vina執(zhí)行docking預(yù)測。

在windows命令行提示符或linux終端下運行命令?vina --config conf.txt，大概需要幾分鐘時間。

輸出結(jié)果包含兩個文件，構(gòu)象文件dockingResult.pdbqt和日志文件docking.log。

Detected 4 CPUs Reading input ... done. Setting up the scoring function ... done. Analyzing the binding site ... done. Using random seed: 2009 Performing search ... done. Refining results ... done.mode | affinity | dist from best mode| (kcal/mol) | rmsd l.b.| rmsd u.b. -----+------------+----------+----------1 -11.5 0.000 0.0002 -10.6 1.425 4.3043 -10.4 2.042 10.9904 -10.3 2.034 10.3265 -10.2 2.517 4.7746 -10.1 1.933 10.9117 -9.9 2.176 10.8848 -9.8 1.794 3.6009 -9.6 1.981 10.865 10 -9.5 2.431 10.943 11 -9.3 2.417 10.370 12 -8.9 2.404 10.285 13 -8.8 4.058 10.904 14 -8.7 5.574 11.291 15 -8.7 4.441 8.312 16 -8.6 5.659 8.929 17 -8.6 4.404 8.275 18 -8.5 5.630 8.900 Writing output ... done.

The key results in a docking log are the docked structures found at the end of each run, ?the energies of these docked structures and their similarities to each other. The similarity of docked structures is measured by computing the root-mean-square-deviation, ?rmsd, between the coordinates of the atoms. The docking results consist of the PDBQ of the Cartesian coordinates of the atoms in the docked molecule, ?along with the state variables that describe this docked conformation and position.

dockingResult.pdbqt: 包含所有docking的模式，通常第一個為結(jié)合最好的構(gòu)象，但如果前幾個能量值相差不大時也有例外。
docking.log: 日志文件，包含結(jié)合能量值(第一列，越低越穩(wěn)定，默認由低到高排序，所以第一個為最好的構(gòu)象)、每個構(gòu)象與第一個構(gòu)象的距離、每個構(gòu)象與第一個構(gòu)象的差別。

用PyMOL可視化docking結(jié)果。

打開PyMOL，依次點選File-Open文件類型選擇All Files-選取結(jié)果dockingResult.pdbqt文件、原始蛋白和配體的pdb文件、原教程的pdbqt文件。

dockingResult.pdbqt: 增加非極性氫的docking結(jié)果
dockingResultAllH.pdbqt: 增加所有氫的docking結(jié)果
original_tutorial_result.pdbqt：原教程中的docking結(jié)果

Docking結(jié)果展示。左圖為蛋白與全部小分子的構(gòu)象展示;中圖為本教程預(yù)測的小分子構(gòu)象(藍色)與標準構(gòu)象(白色)的吻合程度，紅色框起來的區(qū)域為預(yù)測不準確區(qū)域。右圖為本教程預(yù)測的小分子構(gòu)象(藍色)與原教程預(yù)測的小分子構(gòu)象(粉色)的比較。白色化合物為原PDB晶體結(jié)構(gòu)中配體的構(gòu)象，視為金標準。藍色為本教程的只加極性氫的預(yù)測結(jié)果。粉紅色為原教程結(jié)果。黃色為本教程加所有氫的結(jié)果 (與藍色構(gòu)象完全一致，因此顯示不出?？稍趯嶋H操作時嘗試隱藏和顯示不同的分子觀看效果)。

總結(jié)

以上是生活随笔為你收集整理的来一场蛋白和小分子的风花雪月的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：一篇综述翻译解读文章的发出也需要数易其稿
下一篇：如果不是没有钱，谁想测3个重复？