日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

python计算两组数据的相关性_python-计算数据的相关性

發(fā)布時間:2023/12/20 python 61 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python计算两组数据的相关性_python-计算数据的相关性 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

先解釋下什么叫數(shù)據(jù)的相關(guān)性:

計算兩個數(shù)組的平均值,如果兩個數(shù)組中的兩個值都大于平均值或者都小于平均值,則得到true. 如果一個大于平均值一個小于平均值,則得到false.最后計算true和false的個數(shù).

比如,兩個數(shù)組[1, 2, 3, 4] and [4, 5, 6, 7] , 得到 (4, 0). 因為 1 和 4 都低于他們所在數(shù)組的平均值, 2 和 5 也都低于他們所在數(shù)組的平均值, 3 和 6 都高于他們所在數(shù)組的平均值, 4 和 7 也都高于他們所在數(shù)組的平均值.所以計算結(jié)果為true的有4個,false的為0.

如果數(shù)組是[1, 2, 3, 4] and [7, 6, 5, 4], 那結(jié)果就是 (0, 4). 因為 1 低于他所在數(shù)組的平均值而 7 高于們所在數(shù)組的平均值, 其它幾項也類似...

一個栗子:

比如有如下數(shù)據(jù),20個城市的人均壽命和城市的gdp,計算壽命和gdp的相關(guān)性就是,計算是否壽命較高的城市,gdp也會較高,壽命較低,gdp也較低...就是說,gdp和壽命,是否相關(guān)...如果計算得到的true比較多,那就是表示是相關(guān)的,如果得到的false比較多,那就表示不相關(guān).

countries = ['Albania', 'Algeria', 'Andorra', 'Angola', 'Antigua and Barbuda',

'Argentina', 'Armenia', 'Australia', 'Austria', 'Azerbaijan',

'Bahamas', 'Bahrain', 'Bangladesh', 'Barbados', 'Belarus',

'Belgium', 'Belize', 'Benin', 'Bhutan', 'Bolivia']

life_expectancy_values = [74.7, 75. , 83.4, 57.6, 74.6, 75.4, 72.3, 81.5, 80.2,

70.3, 72.1, 76.4, 68.1, 75.2, 69.8, 79.4, 70.8, 62.7,

67.3, 70.6]

gdp_values = [ 1681.61390973, 2155.48523109, 21495.80508273, 562.98768478,

13495.1274663 , 9388.68852258, 1424.19056199, 24765.54890176,

27036.48733192, 1945.63754911, 21721.61840978, 13373.21993972,

483.97086804, 9783.98417323, 2253.46411147, 25034.66692293,

3680.91642923, 366.04496652, 1175.92638695, 1132.21387981]

life_expectancy = pd.Series(life_expectancy_values)

gdp = pd.Series(gdp_values)

# 計算相關(guān)性的函數(shù)

defvariable_correlation(pd_1, pd_2):

pd_1_mean=pd_1.mean()

pd_2_mean=pd_2.mean()

# 都高于平均值或都低于平均值的,得到true,一個高一個低的,得到false

result_series= ((pd_1 > pd_1_mean) &\

(pd_2> pd_2_mean)) |\

((pd_1< pd_1_mean) &\

(pd_2

# 計算true的個數(shù)

num_same_direction=result_series.sum()

# 計算false的個數(shù)

num_different_direction= len(result_series) - num_same_directionreturn(num_same_direction,num_different_direction)print(variable_correlation(life_expectancy,gdp))

# 結(jié)果

(17,3)

說明壽命和gdp是相關(guān)的.

總結(jié)

以上是生活随笔為你收集整理的python计算两组数据的相关性_python-计算数据的相关性的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。