DNA编码约束
DNA編碼約束及分析
1 基于漢明距離的編碼約束
設DNA序列X和Y分別為:X=5`-x1x2......x3-3`,Y=5`-y1y2......y3-3`
(1)漢明距離約束:
l??任意兩個碼字之間對應位上碼元取值不同的位的數目定義為這兩個碼字之間的漢明距離,如:10100和11101,漢明距離為2。
l??在DNA計算中指任意兩個DNA鏈序列的所有對應位置字符不同的總數。
漢明距離H(X,Y):
(2)相似度約束:描述兩個DNA序列X和Y堿基組成的相似程度。
相似度Similarity(X,Y):H(*,*)表示漢明距離,當k>0時,表示右移;當k<0時,表示左移;k表示移動位數。若漢明距離減小,Similarity也隨之減小。Similarity值較小時序列X和Y就非常相似,序列X和YC之間互補的堿基則多,容易出現非特異性雜交;Similarity值較大時序列X和YC之間互補的堿基則少,不會出現非特異性雜交。
(3)?H-measure約束
H(X,Y)表示漢明距離,當k>0時,表示右移;當k<0時,表示左移;k表示移動位數。YC表示DNA序列Y的補鏈。H-measure大表示不會雜交,有效避免非特異性雜交等錯誤。
反補漢明距離約束:DNA實驗中單鏈DNA分子在溶液中任意擴散,因此X可能和Y的反向序列YR發生雜交。反補漢明距離H(X,YRC)用來描述X和YRC之間的相似程度。H(X,YRC)越大,說明X和YRC不同堿基個數越多,那么X和YR互補對就越少,因此不容易出現非特異性雜交。反之,H(X,YRC)越小,說明X和YRC不同堿基個數越少,那么X和YR越易出現非特異性雜交。
2 DNA化學特性約束
(1)?解鏈溫度約束
解鏈溫度(Tm)是雙鏈DNA分子在加溫變性過程中,有50%的DNA分子打開雙鏈編程單鏈時的溫度。Tm是評價DNA分子化學熱力學穩定性的一個重要參數。DNA計算要求DNA分子具有一致的解鏈溫度。
根據Wallace法則,計算公式:Tm=(A+T)*2oC+(C+G)*4oC (<20bp)
根據GC百分含量,計算公式:Tm=81.5+16.6*log[Na+]+41(G+C)-500/|x|
根據Nearest-Neighbors熱力學模型,計算公式:
是相鄰堿基的總焓;是相鄰堿基的總焓;R為摩爾氣體常量(1.987cal/kmol);C為DNA分子濃度。根據上面三個Tm值計算式可以看出,GC含量高,Tm值大;DNA分子濃度大,Tm值大;溶液pH值大,Tm值大。
(2)?化學自由能約束
任意兩個DNA分子X和Y的雜交反應的化學方程式表示:
X+Y<=>YX
X+Y-||=>YX,單鏈DNA分子X、Y釋放能量,形成一條雙鏈。
X+Y=>YX+||,雙鏈DNA分子X、Y吸收能量,分成兩條單鏈。
其中YX代表雜交后的雙鏈。有化學熱力學可知,雜交反應的方向為自由能減小的方向。自由能是參加化學反應的單鏈DNA分子從高能狀態自發地向低能量狀態的雙鏈分子變遷所釋放的能量。
自由能()的變化通常為負值,即<0。是DNA雙鏈穩定性的度量,其絕對值越高,DNA雙鏈越穩定,已發生特異性雜交。給定最小自由能變化閾值,使DNA解集C中的任意兩個DNA分子發生特異性雜交的都大于該閾值,從而不能形成穩定的雙鏈DNA結構,阻止非特異性雜交的發生。
表示近堿基對的自由能;ni表示個數;表示起始位置GC配對的修正值;表示起始位置AT配對的修正值;表示自補DNA序列的修正值。
在進行編寫序列時發生特異性雜交GT幾乎與AT一樣穩定,而GC百分比含量滿足一定的要求,選擇C而不選擇G。
總結
- 上一篇: 数字IC设计——跨时钟域篇1(时钟域)
- 下一篇: 【XJTUSE软件项目管理复习笔记】 第