数据分析学习记录(二)---响应曲面法及Design-Expert的简单使用
數據分析學習記錄(二)—響應曲面法及Design-Expert的簡單使用
注:本文參考博客鏈接:https://www.biomart.cn/experiment/793/2714853.htm一 引言
響應曲面法(Response surface methodology)在百度百科上的解釋:
“響應曲面法是優化隨機過程的統計學試驗方法。目標是尋找試驗指標與各因子間的定量規律,找出各因子水平的最佳組合。在多元線性回歸的基礎上主動收集數據,以獲得具有較好性質的回歸方程。建立的復雜多維空間曲面較接近實際情況,所需要的試驗組數相對較少,在模擬和系統動力學中得到廣泛應用。”
對于我來說怎么樣去更簡單直觀的理解它是我在自學時首要考慮的問題。第一點,我們為什么需要使用響應曲面法?這里就要引出另一個最常用的過程優化方法,單因素試驗。
單因素試驗是假設各因素間不存在交互作用的前提下,每次只改變一個因素,其他因素需要保持在恒定水平下,再去研究不同試驗水平對響應值的影響。
而在實際情況中過程影響因素十分復雜,并且因素與因素之間通常都會存在一定的交互作用,當試驗因素很多的時候,我們需要進行數次的單因素分析以及較長的試驗周期才能逐個優化各因素,這樣效率未必太低。
此時又不得不提到一個效率比單因素分析更高的過程優化方法,那就是正交試驗。正交試驗可以同時考慮多因素,在合理減少單因素分析的試驗次數的情況下,尋找最佳的因素水平組合,通過方差分析得到影響結果的主次因素,但正交試驗在處理因素間交互作用時需要設計交互作用表,當因素間的交互更為復雜時,正交試驗的工作量也會隨之上升。
于是。。
響應曲面法應運而生。 響應曲面法又叫回歸設計,其實了解過響應曲面法的分析原理后對于它這個名字就不難理解了,它在多元線性回歸的基礎上建立一個包括各顯著因素的一次項、二次項和任何兩個因素之間的一級交互作用項,可以說是集統計、數學和計算機與一體的統計學范疇的過程優化方法。
響應曲面法通過設計合理的少次數的試驗,精確研究各因素和我們想得到的響應值之間的關系,快速有效的確定多因素系統的最佳條件。
二 實例
這里我找了一篇文獻,用其中的數據分析結合Design-expert軟件進行響應曲面分析。響應面常用的方法有兩種:中心復合試驗設計(central composite design,CCD)和 Box-Behnken 試驗設計(BBD)。
常用的響應面設計和分析軟件有 Matlab、SAS 和 Design-Expert。在已經發表的有關響應面(RSM)優化試驗的論文中,Design-Expert 是使用最廣泛的軟件。
參考文獻信息:
[1]胡棟, 柯靈超, 張敬宇,等. 響應面法設計優化阿維菌素化學合成發酵培養基[J]. 中國抗生素雜志, 2018, 043(008):1055-1061.
首先打開軟件,選擇新建分析,然后選擇響應曲面分析,選擇第二個Box-Behnken ,如圖:
我們對照文獻中的數據表填寫,輸入對應的因素數量以及試驗中的絕對因素(默認為0),然后輸入因素的名稱單位、最大值和最小值,點擊continue進入下一個頁面:
在這里填寫對應我們想優化的響應值,這篇文獻中只有 一個響應值,為阿維菌素提高百分數,于是我們填寫進去,單位為**%**,點擊continue:
如上圖的表后面的響應值數據是需要手動輸入進去的,對應上面那一張表里的數據。
輸入好之后我們點擊Analysis的R1:Transform 選項卡,一般選擇默認值即可。如果有別的要求,可以根據需要和指示查找每種模式的詳細介紹再選擇。
FitSummary,可以看下建議的因素。
Model 選項卡取默認值即可,點擊 ANOVA 選項卡,顯示方差分析,方差的顯著性檢驗,系數顯著性檢驗回歸方程。
點擊 Diagnostics 選項卡,依次點擊左端選項,首先展示的是 Normal Plot,參差的正態規律分布圖,圖中的點越靠近直線越好。
第二個展示殘差與方程預測值的對應關系圖,分布越分散越無規律越好。
最后展示的是預測值和試驗實際值的對應關系圖,點越靠近同一條直線越好。
然后點擊 Influence 后再點擊 Report 進入結果界面,數據顯示如圖,包含試驗實際測量值(左)和方程預測值(右)。
然后點擊 Model Graphs 查看等高線圖,等高線圖考察每兩個因素對因變量造成的影響,并由擬合的方程形成等高線,為二維平面圖形,可經由該圖找出較好的范圍。
三維響應曲面圖可更加直觀地看出兩因素的影響情況,可以很直觀地找出最優范圍,剛才所看到的二維等高線圖即為三維響應面圖在底面的投影圖。
接下來是關鍵的優化條件選項,根據實際情況確定每個因素可以取值的范圍,然后進行「響應值目標」的確定,每個試驗都有不同的目的,比如此處我們想要找到能使阿維菌素最大產出量的最優培養條件,但別的試驗中對目標的要求有需要最大值,有需要最小值,有時候需要把結果穩定在某個范圍或者需要一個固定的數值。那么在這四種模式中就可以選擇其相對應的情況。
點擊 Solutions 選項卡,即可看到經過分析得到的最優值,一般會列出許多方案,第一個方案就是各因素取最優值后的結果可取到的最大化的解決方案,為預測值。
以上!!!若有不對,歡迎交流指出。
總結
以上是生活随笔為你收集整理的数据分析学习记录(二)---响应曲面法及Design-Expert的简单使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python传奇自动打怪脚本_GOM引擎
- 下一篇: Web业务性能优化技术总结