日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

【scipy 基础】--正交距离回归

發(fā)布時間:2023/11/16 windows 48 coder
生活随笔 收集整理的這篇文章主要介紹了 【scipy 基础】--正交距离回归 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

ScipyODR正交距離回歸(ODR-Orthogonal Distance Regression)模塊,適用于回歸分析時,因變量和自變量之間存在非線性關(guān)系的情況。
它提高了回歸分析的準確性和穩(wěn)健性。對于需要解決非線性回歸問題的科研人員和工程師來說,它具有非常重要的意義。

ODR正交距離回歸模塊的作用主要在于它將正交化方法和距離回歸結(jié)合起來,解決了傳統(tǒng)線性回歸模型在處理非線性問題時的局限性。它通過將自變量進行正交化處理,使得因變量和自變量之間的非線性關(guān)系能夠更好地被擬合出來。

1. 主要功能

scipy.odr模塊針對的領(lǐng)域比較明確,所以不像之前介紹的模塊有那么多函數(shù)。
此模塊的主要函數(shù)包括:

函數(shù)名 說明
Data 要擬合的數(shù)據(jù)
RealData 數(shù)據(jù)的權(quán)重為實際標準差和/或協(xié)方差
Model Model 類存儲有關(guān)您希望擬合的函數(shù)的信息
ODR ODR 類收集所有信息并協(xié)調(diào)主要擬合例程的運行
Output 輸出類存儲 ODR 運行的輸出
其他函數(shù) 調(diào)整擬合和模型的一些函數(shù)

一般來說,使用前5個函數(shù),就可以進行一些正交距離回歸分析。

2. 使用示例

正交距離分析一般步驟如下:

2.1. 準備數(shù)據(jù)

數(shù)據(jù)采用以前收集的江蘇省人口數(shù)據(jù),獲取地址:https://databook.top/jiangsustat/renkou

import pandas as pd

data = pd.read_csv("/path/to/人口-年末常住人口(萬人).csv")
data.head(10)


一共31條數(shù)據(jù),1990年~2020年江蘇省的人口變化數(shù)據(jù)。

用散點圖看看數(shù)據(jù)的變化趨勢:

from matplotlib.ticker import MultipleLocator
import matplotlib.pyplot as plt

ax = plt.subplot()
ax.scatter(data["year"], data["value"], marker='*', color='r')
ax.xaxis.set_major_locator(MultipleLocator(5))
ax.set_title("江蘇省人口變化")

plt.show()

2.2. 創(chuàng)建模型

使用scipy.odr模塊中的Model函數(shù)創(chuàng)建一個擬合的模型。

import scipy.odr as sodr

# 模型函數(shù)
def model_func(p, x):
    k, b = p
    return k * x + b

model = sodr.Model(model_func)

2.3. 生成數(shù)據(jù)

將上面的人口數(shù)據(jù)data轉(zhuǎn)換為可以用于ODR運算的數(shù)據(jù)。

# x是數(shù)據(jù)
x = range(len(data))

# 轉(zhuǎn)換數(shù)據(jù)用RealData或者Data函數(shù)都可以
rdata = sodr.RealData(x, data["value"])
# rdata = sodr.Data(x, data["value"])

DataRealData函數(shù)都是用來構(gòu)造數(shù)據(jù)的。
一般來說,Data函數(shù)用來構(gòu)造理論數(shù)據(jù);
RealData函數(shù)用來構(gòu)造實際數(shù)據(jù)的,且RealData中還可以設(shè)置權(quán)重。

這里沒有設(shè)置權(quán)重,用哪個函數(shù)都可以。

2.4. ODR運算

有了數(shù)據(jù)和模型之后,就可以進行ODR運算了。

odr = sodr.ODR(rdata, model, beta0=[0, 1])

result = odr.run()
result.pprint()
# 運行結(jié)果:
Beta: [  61.01340781 6724.77566283]
Beta Std Error: [ 1.11208495 19.3974215 ]
Beta Covariance: [[  1.51592414 -22.73886321]
 [-22.73886321 461.20026764]]
Residual Variance: 0.8158277156001223
Inverse Condition #: 0.2520617152422754
Reason(s) for Halting:
  Sum of squares convergence

其中 BetaBeta Std Error就擬合的參數(shù)值和參數(shù)的標準差。

2.5. 輸出結(jié)果

根據(jù)計算結(jié)果,繪制出圖形更容易理解。

# 擬合參數(shù)和參數(shù)的標準差
beta = result.beta
beta_std = result.sd_beta

# 擬合的曲線
y = beta[0] * x + beta[1]

# 擬合曲線的標準差上限
y_up = (beta[0] + beta_std[0]) * x + (beta[1]+ beta_std[1])

# 擬合曲線的標準差下限
y_down = (beta[0] - beta_std[0]) * x + (beta[1] - beta_std[1])

# 繪制擬合的曲線
ax = plt.subplot()
ax.scatter(data["year"], data["value"], marker='*', color='r')
ax.xaxis.set_major_locator(MultipleLocator(5))
ax.set_title("江蘇省人口變化")

ax.plot(x, y, color="b", label="擬合曲線")
ax.plot(x, y_up, color="y", label="標準差上限")
ax.plot(x, y_down, color="g", label="標準差下限")

plt.legend()
plt.show()

這就是通過ODR模塊擬合的人口變化情況。

3. 總結(jié)

ODR正交距離回歸之所以作為Scipy的單獨模塊,是因為它是一種特殊的曲線擬合方法,
它使用正交化和距離加權(quán)的最小二乘法來處理具有非線性關(guān)系的輸入變量,并旨在找到最優(yōu)的模型以最小化預測誤差。
這與一般的曲線擬合在方法和目標上有很大的不同。

后續(xù)介紹Scipy庫中的其他模塊時,還會介紹其他的曲線擬合函數(shù),到時候可以和這里的ODR方法對照比較一下。

總結(jié)

以上是生活随笔為你收集整理的【scipy 基础】--正交距离回归的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。