分子模拟软件amber_使用Amber创建小分子与蛋白质复合蛋白的坐标和拓扑文件
大家好,又見面了,我是你們的朋友風君子。
復合蛋白amber坐標和拓撲文件的創建
作者:朱寧 來源:大科研小分享
前言
分子動力學(Molecular Dynamics, MD)是一門結合物理,數學和化學的綜合技術。目前主流分子動力學軟件有NAMD、GROMACS、AMBER等。
AMBER分子動力學程序包是由加州圣弗蘭西斯科大學(UCSF)的Peter A Kollman和其同事編寫的,程序很全,大約包含60多個程序,相互協調工作。現在已經發展到版本20。AMBER功能涵蓋種類非常多的生物分子,包括蛋白、核酸以及藥物小分子。
本文中,筆者將以T4溶菌酶L99A / M102Q和2-丙基苯酚(PDB ID:3htb)的復合蛋白為例,在ubuntu環境下創建amber MD的坐標和拓撲文件,以便于學習、分享之用,如有侵權,請聯系刪除。
操作環境:ubuntu18.04 操作軟件:ambertools19、文本編輯器 文件準備:3htb.pdb 小分子resp電荷計算網站:
https://upjv.q4md-forcefieldtools.org/REDServer-Development/
01
PDB文件的準備 首先,我們對需要模擬的復合蛋白的PDB文件進行清理 (PDB文件中用于設置amber模擬的唯一必需數據或有用數據是:原子名稱,殘基名稱,某些與配體成鍵的水分子可能還有鏈標識符(如果存在多個鏈)以及重原子的坐標),對于復合蛋白如果有氫原子,建議是全部刪除后,利用
reduce、H++、chimera 或者
amber 中
l
eap 添加。 打開終端,終端輸入命令:
pdb4amber-i3htb.pdb-ocomplex.pdb--reduce--dry#--reduce:用reduce加氫,--dry:刪除所有水分子。#如果想刪除所有H原子,后面加上-y 即可,示例中的3htb.pdb中沒有H原子。
注:
pdb4amber不能清理PDB文件中MD模擬不需要的鏈以及多余的配體,需要手動刪除。同時,
pdb4amber清理PDB文件時會預測組氨酸的質子化狀態(
δ 、 ε、δ 和ε位置均質子化),然后分別對組氨酸殘基重命名(
HID,HIE,HIP)。示例中3hth.pdb中某些組氨酸殘基名
HIS,在
pdb4amber 清理PDB文件后在
complex.pdb中組氨酸殘基名為
HID。對于其他殘基質子化 狀態可通過其他軟件(
H++、PROPAK、MOE及其他藥物設計軟件等)進行預測,然后手動或者軟件自動修改,也 有人說其他氨基酸質子化不影響H鍵,正好筆者比較懶,其他氨基酸質子化的步驟便省略了,但是
amber19手冊 12.2有關其他氨基酸質子化殘基命名的說明,因此筆者在
第四節中敘述了關于amber其他氨基酸殘基的質子化狀態以及命名。用
pdb4amber自動清理后,用文件編輯器打開
complex.pdb我們刪去配體中還有多余的磷酸鹽離子(
PO4)和β-巰基乙醇(
BME),保留2-丙基苯酚(
JZ4),保存
complex.pdb。刪除多余的磷酸鹽離子(
PO4)和β-巰基乙醇(
BME)后,我們對PDB文件重新編號。終端輸入:
pdb4amber -i complex.pdb -o complex-mod.pdb
然后復制2-丙基苯酚(
JZ4)的坐標,粘貼至另一個新建文本文件中,保存為PDB文件。這里筆者保存為
ligand.pdb,即小分子配體PDB文件。
02
小分子力場參數化小分子力場參數化主要是分兩個步驟,首先我們的計算小分子的原子電荷,可以選擇
bcc電荷,也可以選擇
resp電荷。不要求太高精確性,就采用
bcc電荷,計算方法也簡單。要求比較高的話,采用resp電荷。然后
parmchk2檢查帶有原子電荷的力場庫文件
(
mol2 or amber prep
),補齊
gaff力場中缺失的鍵, 鍵角, 二面角參數等,生成力場參數文件
frcmod。 采用
bcc電荷的話:使用
antechamber和
parmchk2即可
antechamber-iligand.pdb-fipdb-oligand.mol2-fomol2-cbccparmchk2 -i ligand.mol2 -f mol2 -o ligand.frcmod
采用resp電荷的話:可以用一些量化軟件(如Gaussian 、Multiwfn、GAMESS)進行計算然后擬合以及R.E.D網站。
https://upjv.q4md-forcefieldtools.org/REDServer-Development/ 這里我們介紹下這個花里胡哨的網站,該網站提供電荷的計算擬合,以及力場的開發等等。當然網站是免費的,正經人誰用付費的。注冊一個賬號,這樣網站分配的計算資源多一些,而且可以使用Gaussian計算,不用擔心版權。提交文件后,他會在任務運行和結束發送郵件。使用該網站,我們必須提供的小分子的PDB文件,示例即
ligand.pdb。網站沒更新前還必須提供 System.config,Project.config文件,用于自定義項目配置參數。包括分子名稱,分子總電荷,自旋多重度以及擬合電荷的基組、內存、并行計算核數等。更新后就不是必要的了,我們選擇默認設置就好
(
總電荷和自旋多重性分別為0和1,執行幾何優化和MEP補償、最大內存為61440 ,核心數為8等
)。如下圖所示,這里我們利用網站計算生成的力場庫文件
(Force field library)-Mol-sm_m1-c1.mol
2,下載文件后,移至工作目錄,名字太長了,重命名 為
ligand.mol2 。 該網站還直接提供力場參數文件(基于amber10)和leap腳本,筆者認為其使用過于復雜,花里胡哨,故不做選擇,有興趣的可自行嘗試。 獲取力場庫文件
ligand.mol2 ,終端輸入:
parmchk2 -i ligand.mol2 -f mol2 -o ligand.frcmod
這樣我們就得到了力場參數文件
ligand.frcmod和以及帶有原子電荷的庫文件
ligand.mol2。
03
創建坐標和拓撲文件 準備好了所需的文件后,接下來終端輸入以下命令即可:
tleap #打開tleapsource leaprc.protein.ff19SB #加載蛋白質力場source leaprc.gaff2 #加載gaff2力場source leaprc.water.tip3p #加載水模型loadamberparams ligand.frcmod #導入小分子力場參數文件JZ4=loadmol2 ligand.mol2 #加載小分子庫文件,JZ4為PDB文件小分子殘基名。com=loadpdb complex-mod.pdb #導入復合蛋白charge com #計算體系電荷,示例的體系帶正電,故此加入Cl-addions com Cl- 0 #加入抗衡離子使體系電中性solvatebox com TIP3PBOX 10.0 #加入水盒子,大小為10埃saveamberparm com complex.top complex.crd #創建拓撲和坐標文件quit #退出
當然也可像筆者這樣將命令放到一起,創建一個
tleap.in 的腳本,終端輸入:
tleap -s -f tleap.in > tleap.out
04
氨基酸殘基質子化 質子化其實就是氨基酸N端多加了質子(氫原子)。氨基酸殘基的質子化狀態會隨著蛋白質所在環境的pH值不同而發生變化,質子化的殘基如果形成氫鍵,因為氫原子的位置不同,所以跟普通的殘基也是不一樣的。 對于環境pH值比較敏感的殘基主要包括:HIS,ASP,GLU,LYS。 對于
HIS ,
δ 和ε位置均質子化 狀態下改為
HIP ,
δ 和ε位置分別質子化為
HID 和
HIE 。
HID 和
HIE 的區別在于質子化的位置分別為
δ
N 和
ε
N ,使用
pdb4amber 時,它會自動預測并且修改。 對于
ASP,GLU,LYS質子化分別對應
ASH,GLH,LYN
。創建amber坐標和拓撲文件之前,可手動將殘基名修改成對應的表示質子化的殘基名,然后加氫。當然,不改對體系的影響也不大。一般情況下,修改組氨酸殘基名
HIS就可以了。 最后,筆者認為如果發生質子化的殘基不在活性口袋區域,那這些殘基改不改都無所謂了。不在活性口袋,根本沒有必要研究它,當然這僅是筆者的個人看法。 后記 對于分子動力學模擬,筆者也是剛接觸不久,文中所寫也是筆者自行參閱amber手冊以及網上的一些資料得出,若有不當指出,歡迎指正。
– END –
總結
以上是生活随笔為你收集整理的分子模拟软件amber_使用Amber创建小分子与蛋白质复合蛋白的坐标和拓扑文件的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 相似6-3
- 下一篇: Linux 脏数据回刷参数与调优