[量子计算]一种用于蛋白质计算的结构化学量子计算算法。(QUANTUM ALGORITHMS FOR STRUCTURAL MOLECULAR BIOLOGY)
摘要
RQuanTech開發了一種創新算法,可用于結構分子生物學應用。
介紹
數十億年來,進化過程優化了構成天然蛋白質的氨基酸序列,以滿足制造它們的生物體的需要。所以我們問:我們可以使用計算來設計適合我們生物醫學和工業需求的非天然蛋白質嗎?
這個問題是組合優化問題,因為蛋白質設計計算的輸出是一系列氨基酸。由于天然存在的蛋白質的多樣性,用天然存在的蛋白質開始蛋白質設計計算然后對其進行修飾以實現所需功能是可能且非常有用的。這些可以形式化為加權鏈中的問題。我們可以用不同的特征代表每個氨基酸,蛋白質由構成它的氨基酸字符串表示。代表蛋白質的鏈被分成子鏈,確定每個子串的質量,并將質量列表與蛋白質數據庫進行比較。這種技術的挑戰之一是處理非常大的字符串,這些字符串可能有幾個可能的子串。選擇的子串數對于良好的結果至關重要。同樣重要的是用于比較這些字母的評分函數,以找到最佳全局比對或兩個序列之間的最佳局部比對。不幸的是,要找到最能捕捉氨基酸類型之間相似性的評分函數的參數并不容易。這導致以取代矩陣的形式開發出許多類型的分數,以期產生具有生物學意義的序列比對。另外,當要比較的兩種蛋白質之間的相似性低時,通常缺乏相應序列比對的質量。因此,序列比對技術通常是將蛋白質分類為折疊或檢測同源性的差的方法,這兩者都是希望解決蛋白質結構預測問題的基本任務。已經開發了許多方法來規避這些問題。
改進這些方法的一種選擇涉及一次考慮多種氨基酸。這個想法導致了過去三十年來發展起來的“無對齊”方法的概念。序列比對方法以及最近的字符串內核方法關鍵取決于評分或替換矩陣。那些取代矩陣基本上將氨基酸編碼為數值陣列,其中這些值來自參考比對(PAM和BLOSUM矩陣)的統計分析,或來自氨基酸的物理和化學性質。雖然這些矩陣已經用于折疊識別問題,但它們還沒有針對這樣的任務進行優化。已經嘗試進行這樣的優化;然而,沒有一個超過了公認的BLOSUM62矩陣。
在該領域可以實現的一個重要的潛在步驟是實現量子算法,其允許跳過上述生物計算方法中呈現的非多項式(NP)問題。
示例應用
1在我們的提案(腳注)中,我們介紹了RQuanTech量子算法如何加速基于知識的統計力場的估計以及推導最終蛋白質配置的成本函數。我們展示了幅度估計算法如何能夠大幅度減少高可信度估計結構所需的步驟數。
對于蛋白質結構問題的建模,主要挑戰是樣本的潛在配置的指數數量。通常通過蒙特卡羅評估來搜索最佳配置。
量子計算承諾為各種任務提供算法加速,例如分解或優化。
量子傅立葉算法與RQuanTech實現的Shor算法相結合,可以擴展和推廣到函數優化,幅度放大和估計,積分,基于量子行走的元素清晰度方法,以及馬爾可夫鏈算法等。特別地,幅度估計算法可以提供接近二次加速度以估計期望值,并且因此提供對經典地使用蒙特卡羅方法的問題的加速。
RQuanTech提出了如何將量子計算用于蛋白質結構問題建模的新視角。我們結合眾所周知的量子技術,如振幅估計和蒙特卡羅量子算法與CABS粗粒蛋白模型。
蒙特卡羅方法論文的實施
正如我們在下圖中可以看到的那樣,本文提出了蒙特卡羅方法的實現,如圖所示:
CABS模型的抽樣方案。藍色面板顯示蒙特卡羅(MC)迭代(循環)的實現細節。橙色面板顯示可以在單個MC步驟中執行的所有動作。模擬被組織為一組嵌套循環,其中s個MC步驟被組織成y個循環,并且這些循環在退火循環中(a,y或s循環的數量可以由用戶控制) CABS-flex和CABS-dock獨立軟件包[72])。在橙色面板中,數字1到5表示可用的移動,與每個MC步驟中執行移動的嘗試次數一起顯示。得到的軌跡由在每個MC循環結束時保存的模擬快照組成。
RQUANTECH MONTECARLO實施
RQuanTech蒙特卡洛實施方式如下。
假設最優結構為P,P’是從k個樣本獲得的近似值。假設成本函數f(ST)的隨機變量以方差為界,即V [f(ST)] <λ2。那么估計P’是ε遠離最優的概率由切比雪夫的不等式確定
問題[| P’-P | ≥ε]≤λ2/kε2
因此,為了獲得恒定的成功概率,我們需要
k = O(λ2/ε2)
樣本估計加性誤差ε。量子算法的任務是改善從ε2到ε的ε依賴性,從而為給定誤差提供二次加速。
在我們提出量子算法之前,我們展示了如何將結構值編碼為量子算法以及如何獲得與經典算法相同的ε依賴性。然后,我們通過使用幅度估計的基本量子算法來顯示二次加速。
蒙特卡羅的量子算法
使用幅度估計量子蒙特卡羅。圖如下。 (算法方案)
(a)n + 1量子比特相位估計酉以F:= R(A?I2)表示,簡單旋轉酉,Z:= | I2n + 1> - 2 | 0 n + 1> <0 N + 1 |和V:= | I2n + 1> - 2I2n?| 1> <1 |。
(b)在任意狀態下可視化Q:= US,S = VUV和U = FZF?
| ψψ>在χ和V(χ)的范圍內。首先, - S on |的動作ψψ>沿V(χ)反射,得到中間-S | ψψ>。然后,-U作用于-S | ψψ>通過沿|χ>反射得到的狀態Q |χ>在| x>和|χ→超平面中逆時針旋轉了角度2θ。
(c)相位估計電路。這里,A通過在| x>中準備疊加來編碼隨機性,而R將隨機變量編碼為ancilla量子比特的| 1>狀態。兩個步驟之后的輸出是多量子位狀態|χ>。然后通過調用相位估計來進行幅度估計,以在量子比特的寄存器中編碼旋轉角度θ,該量子比特的寄存器被測量以獲得估計^θ。
(d)由A(或等效G)制備的疊加是蛋白質結構變化的離散化。在這種情況下,R編碼成本函數。
在逆量子傅里葉變換之后,我們將獲得對蛋白質結構的最佳估計。
結論
我們已經描述了用于蛋白質結構建模的量子算法。我們假設CABS的關鍵特征(其表示,力場和用于MC的運動的規模)是已知的,并且可以有效地準備相應的量子態。
此外,我們假設成本函數的有效可計算性。在這些假設下,我們展示了估計蛋白質結構所需樣本數量的二次加速,直到給定誤差:如果所需精度為ε,則經典方法顯示樣本數量的1 /ε2依賴性,而RQuanTech量子算法顯示1 /ε依賴性。
進一步的考慮因素
RQuanTech Quantum算法為與結構生物學分子領域中經常使用的組合算法相關的計算提供了顯著的加速。原則上,當前的計算可以減少到更短的時間尺度,這將允許更多的結構容量得到解決。
我們正在尋求與計算機輔助蛋白質工程領域的最佳合作,以在實際環境中展示(試點)方法學的相關性。
總結
以上是生活随笔為你收集整理的[量子计算]一种用于蛋白质计算的结构化学量子计算算法。(QUANTUM ALGORITHMS FOR STRUCTURAL MOLECULAR BIOLOGY)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 怎么留住好员工来实现企业优势
- 下一篇: 软件工程试题