日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

拟合一条曲线_数据预测与曲线拟合

發布時間:2024/4/18 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 拟合一条曲线_数据预测与曲线拟合 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

什么是曲線擬合

所謂的曲線擬合,就是使用某一個模型(或者稱為方程式),將一系列的數據擬成平滑的曲線,以便觀察兩組數據之間的內在聯系,了解數據之間的變化趨勢。

曲線擬合的作用

在數據分析時,我們有時需要通過已有數據來預測未來數據。在一些復雜的數據模型中,數據維度很多,數據之間的關系很復雜,我們可能會用到深度學習的算法。但是在一些簡單的數據模型中,數據之間有很明顯的相關性,那我們就可以使用簡單的曲線擬合來預測未來的數據。

曲線擬合的方法

Excel曲線工具

假設我們有一組用戶生命周期價值(LTV)和天數的對應數據

DayLTV1$0.202$0.353$0.454$0.525$0.576$0.607$0.628$0.63

將數據放進Excel中,插入折線圖

右擊藍色曲線,選擇“添加趨勢線”,并選擇趨勢線為“對數”,并勾選“顯示公式”

可以看到,曲線圖中出現了一條虛線的曲線,并顯示了對應的公式為

Excel的趨勢線工具提供了幾個常用的函數,包括指數函數、對數函數等,可以滿足一般需求。但是如果數據曲線相對復雜的話,就需要用到下面的工具了。

Excel Solver

要使用Solver,首先需要進入Excel的選項,啟用“規劃求解”工具

啟用之后,在工具欄“數據”標簽頁下,會多出一個“規劃求解”的工具

我們先看一下這個工具的界面,就可以大概了解它的功能。簡單來說,Solver可以通過改變一些單元格的值,來使一個目標單元格的值最接近理想值。

我們還是用之前的表格來舉例如何使用Solver。現在已經知道了LTV對于Day來說是一條類似對數函數的曲線,可以使用對數函數來模擬。我們假設這個函數是

其中a和b為參數,是可變的。我們調整一下表格,添加一列Estimate LTV,為根據a、b和Day列計算出來的值。再增加一列Diff,為Estimate LTV和Real LTV的差值的平方(平方是為了防止不同行的正負差值會互相抵消),最后加總這些差值。

我們希望通過改變a、b的值,使通過公式得出的LTV與真實LTV的偏差最小,即Total Diff(F18)的值最小。打開規劃求解工具,設置如下

點擊求解,片刻后即可計算出最接近目標的a、b值

可以看到,a、b的值和使用趨勢線得到的值是一樣的。

在線工具

介紹一個非常好用的在線曲線擬合工具:

http://www.qinms.com/webapp/curvefit/cf.aspx

Python matplotlib庫

Python的matplotlib庫有一個自定義公式來擬合曲線的功能。下面代碼演示了通過它來擬合上述例子的過程

# -*- coding: UTF-8 -*- import numpy as np import matplotlib.pyplot as plt from scipy import stats import scipy.optimize as optimizationdata_day = [1,2,3,4,5,6,7,8] #x坐標值|x coord data_ltv = [0.2,0.35,0.45,0.52,0.57,0.6,0.62,0.63] #y坐標值|y coordxdata = np.array(data_day) ydata = np.array(data_ltv)#定義使用的公式|customize equation def lnFunction(x, A, B):return A*np.log(x)+Bguess = [1, 1] #定義初始A、B|initialize a and b try:params, params_covariance = optimization.curve_fit(lnFunction, xdata, ydata, guess) #擬合,A、B結果存入params|curve fitting and store a, b values to paramsprint paramsresult = '' #輸出結果|to store resultfor i in range(1, 15):result += str(round(lnFunction(i, params[0], params[1]), 2)) #將i帶入公式中的x,使用擬合出的A、B值計算y值,并保留兩位小數|calculate result for each i as x using the a, b values, and round the result to 2 pointsif i != 14:result += ',' #每個結果用逗號隔開,并省略最后一個逗號|separate each result with comma, and omit the last commaprint result except:print ''

輸出結果為:

[0.21482987 0.20772681] 0.21,0.36,0.44,0.51,0.55,0.59,0.63,0.65,0.68,0.7,0.72,0.74,0.76,0.77

曲線擬合公式

在前面的例子中,我們使用了對數函數來進行擬合。在上文提到的在線曲線擬合工具網站中,也列出了一些常見的擬合方程,包括直線、多項式、對數、指數等。其中有一個方程對于擬合自然曲線非常好用,就是四參數方程。

四參數方程的格式為:

我們還是用最開始的Day/LTV數據來舉例,比較一下它和對數函數擬合的結果。

四參數方程 – Solver比較

修改一下之前的Excel表,將Estimate LTV列使用的公式修改成四參數方程

在規劃求解設置中,依然是期望Total Diff達到最小值,可變單元格增加了c、d兩個參數

點擊求解,獲得a、b、c、d四個參數的最優解。我們可以看到,Total Diff比使用對數函數時減少了將近一半

四參數方程 – matplotlib比較

同樣,我們修改一下python腳本,改為使用四參數方程。請注意,我們這次添加了一個param_bounds值,將C這個參數限定在了0.001到正無窮。這是因為C在公式中充當了分母,不能等于0,而我還沒找到一個有效的限制C不為0的方法。

# -*- coding: UTF-8 -*- import numpy as np import matplotlib.pyplot as plt from scipy import stats import scipy.optimize as optimizationdata_day = [1,2,3,4,5,6,7,8] #x坐標值|x coord data_ltv = [0.2,0.35,0.45,0.52,0.57,0.6,0.62,0.63] #y坐標值|y coordxdata = np.array(data_day) ydata = np.array(data_ltv)#定義使用的公式|customize equation def fourPL(x, A, B, C, D):return ((A-D)/(1.0+((x/C)**(B))) + D)guess = [1, 1, 1, 1] #定義初始A、B值|initialize a and b param_bounds = ([-np.inf,-np.inf,0.001,-np.inf],[np.inf,np.inf,np.inf,np.inf]) try:params, params_covariance = optimization.curve_fit(fourPL, xdata, ydata, guess, bounds = param_bounds) #擬合,A、B、C、D結果存入params|curve fitting and store a, b, c, d values to paramsprint paramsresult = '' #輸出結果|to store resultfor i in range(1, 15):result += str(round(fourPL(i, params[0], params[1], params[2], params[3]), 2)) #將i帶入公式中的x,使用擬合出的A、B、C、D值計算y值,并保留兩位小數|calculate result for each i as x using the a, b, c, d values, and round the result to 2 pointsif i != 14:result += ',' #每個結果用逗號隔開,并省略最后一個逗號|separate each result with comma, and omit the last commaprint result except:print ''

輸出結果為

[0.0923509 1.73652154 2.41689489 0.70144044] 0.2,0.35,0.45,0.52,0.57,0.6,0.62,0.63,0.65,0.65,0.66,0.67,0.67,0.67

可以看到,相對于Excel Solver來說,matplotlib庫獲得的結果更精準,預測值和真實值幾乎沒有偏差。

總結

以上是生活随笔為你收集整理的拟合一条曲线_数据预测与曲线拟合的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。