日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python爬空气污染实时数据_python数据分析综合项目--空气质量指数分析

發布時間:2024/3/12 python 43 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python爬空气污染实时数据_python数据分析综合项目--空气质量指数分析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

項目背景

近年來,我國的環境問題比較嚴重,很多城市出現了霧霾天氣,當然也有很多城市空氣依舊清新,為了研究具體的空氣環境城市分布,我們采用了假設檢驗以及線性回歸的思想對AQI(空氣質量指數)進行分析和預測,其中AQI的值越大,表示空氣質量越差,AQI值越小,表明空氣質量越好。

提出問題

1.列出空氣質量優秀/較差的五個城市

2.全國空氣質量分布情況

3.臨海城市和內陸城市的空氣質量對比

4.影響空氣指數的因素

5.空氣質量均值驗證

數據字段描述

City 城市名

AQI 空氣質量指數

Precipitation 降雨量

GDP 城市生產總值

Temperature 溫度

Longitude 經度

Latitude 緯度

Altitude 海拔高度

PopulationDensity 人口密度

Coastal 是否沿海

GreenCoverageRate 綠化覆蓋率

Incineration(10,000ton) 焚燒量(10000噸)

導入相應的模塊以及數據集

數據處理

在進行數據分析之前,我們對數據集進行觀察并對其中的缺失值、重復值、異常值進行處理

處理缺失值

我們發現降雨量數據中包含了4個缺失值,為了保證數據的精確,我們查一下降雨量的數據分布

降雨量分布圖

很明顯的呈現右偏分布,因此采用平均數來替代缺失值并不妥,我們這里用中位數來代替

缺失值處理

異常值處理

最常用的異常值檢測方式為3倍標準差檢驗法,我們用此方法篩選出異常數據,并繪制對應的箱線圖

異常值檢測

GDP箱線圖

GDP屬性中檢測出8條異常值,我們這里采取用極端值替換的方式,將異常值替換成最大值

df['GDP'][(df['GDP']upper)]=df['GDP'].mean()+3*df['GDP'].std()

重復值處理

重復值處理比較簡單,篩選出來并刪除即可

df.drop_duplicates(inplace=True)

數據分析及可視化

數據集處理完畢之后,我們開始進行數據分析

1. 列出空氣質量優秀/較差的五個城市

按照AQI降序排列,選出排名前五以及后五的城市,進行可視化,結果如下

空氣質量好的五大城市

空氣質量堪憂的五個城市

結論:空氣質量較好的城市為韶關市、南平市、梅州市、基隆市、三明市,空氣質量堪憂的城市分別為焦作市、錦州市、保定市、朝陽市、北京市

2. 全國空氣質量分布情況

這里我們將AQI指數分為六個等級,并根據等級統計全國空氣質量的等級情況

全國空氣質量等級劃分圖

我們再用散點圖繪制下全國的空氣質量分布

地理分布圖

結論:我國城市的空氣質量集中在一級、二級和三級,高污染城市比例較低;從地理位置來看,西部城市空氣質量優于東部城市,南部城市優于北部城市。

3. 臨海城市和內陸城市的空氣質量對比

根據上面的結論我們發現,仿佛臨海城市的空氣質量普遍高于內陸地區,那么這個結論是否是真的呢?還需要進一步驗證。

首先,我們來統計下不同地理環境的城市數量

內陸、沿海城市數量

第二步,繪制臨海和內陸城市的AQI分布圖

AQI分布

我們發現內陸城市AQI集中分布在50-100區間內,而沿海城市AQI集中分布在0-50區間,在此樣本中,沿海的AQI分布低于內陸城市,但是這畢竟是樣本,無法推測出總體分布情況,還需進一步探測。

第三步,統計AQI均值并繪制分布密度圖

AQI均值

第四步,差異檢驗,查看內陸沿海AQI均值分布是否顯著

我們先假設內陸城市和沿海城市的平均值相同

t檢驗

結果得出支持的概率為0.006,遠低于0.05,因此我們否定原假設,選擇備擇假設,即內陸城市和沿海城市的平均值不相同

結論:經過分析,我們發現有超過99%的概率可以證明臨海城市空氣質量優于內陸城市的空氣質量。

4. 影響空氣指數的因素

為了探究影響空氣質量的具體因素,我們需要計算出兩個變量之間的相關系數,以此進行判斷,這里采用熱力圖進行可視化操作。

sns.heatmap(df.corr(),annot=True,fmt='.2f')

相關系數熱力圖

結論:從顯示結果看出,AQI主要受降雨量和緯度的影響,其中降雨量越多,空氣質量越好(0.4);緯度越低,空氣質量越好(-0.55)

當然,從整個圖片來看,也能發現很多變量之間的關系,比如GDP與焚燒量的正相關系數達到了0.9,溫度與緯度的負相關系數達到了-0.81等。

5. 空氣質量均值驗證

傳聞空氣質量均值在71左右,這個消息是否是準確的呢?我們進行一次驗證。

首先計算樣本的均值

df['AQI'].mean()

結果顯示為75.334

那么總體的均值是否為71呢?這里先假設總體的均值為71,進行t檢驗

驗證

結論:可以看出,偏離均值1.81倍的標準差,而且p值大于0.05,我們接受原假設(即空氣質量均值在71左右)另外,我們還可以計算出在置信度為95%時,空氣質量均值的置信區間為70-80。

總結

空氣質量最好的城市是韶關、南平和梅州,最差的是北京。

分布總體顯示,西部城市空氣質量優于東部城市,南部城市優于北部城市。

臨海城市空氣質量總體好于內陸城市。

降雨量和緯度對空氣質量影響較大。

我國平均空氣質量指數在70-80之間,概率達到95%

總結

以上是生活随笔為你收集整理的python爬空气污染实时数据_python数据分析综合项目--空气质量指数分析的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 天天干天天干 | 欧美综合区| 成人网视频 | 伊人久久久久久久久久久 | 天天色综合av | 久久久久久久久久久国产 | 免费看黄色网址 | 97人人模人人爽人人少妇 | 久久久久99人妻一区二区三区 | 999精品免费视频 | 国产精品无码毛片 | 青青久久av | 一个色在线视频 | 欧美久久视频 | 亚洲中文字幕无码一区 | 国产人妻精品午夜福利免费 | 久久综合婷婷 | 国产精品国语自产拍在线观看 | 午夜男人天堂 | av影院在线播放 | 国产精品日韩欧美一区二区三区 | 美女被男人桶出白浆喷水 | 福利视频导航网 | 99久久网站| 国产极品尤物 | 中日韩毛片 | 天堂网8 | 国产盗摄精品一区二区酒店 | 国产又黄又猛的视频 | 欧美色综合色 | 国产精品伦一区二区三区免费看 | 美女精品| 免费在线观看视频a | 奶波霸巨乳一二三区乳 | 成人动漫亚洲 | 亚洲精品国产精品乱码不卡√香蕉 | 成人欧美日韩 | 91精品国产高清一区二区三区蜜臀 | 懂色av蜜臀av粉嫩av分 | 99久久黄色 | 国产成人精品网站 | 美女在线播放 | 国产在线视频网址 | 亚洲中文字幕一区二区在线观看 | 日本深夜福利 | 男男gay同性三级 | 欲涩漫入口免费网站 | 日韩电影中文字幕 | 亚洲国产精品无码观看久久 | 亚洲日本视频在线观看 | 精品一区二区在线视频 | 在线观看免费视频一区 | 日韩中文字幕久久 | av在线a| 在线国产播放 | 毛片毛片毛片毛片毛片毛片毛片毛片 | 国产午夜三级一区二区三 | 欧美cccc极品丰满hd | 激情视频网站 | 日韩专区中文字幕 | 国产午夜伦鲁鲁 | 国产欧美日韩精品一区 | 超碰女人 | 欧美色综合色 | 国产自产 | 国产乱淫av公 | 关之琳三级做爰 | 日欧美女人 | 182在线视频 | 一本到视频 | 视频一区在线播放 | 女女h百合无遮涩涩漫画软件 | 亚州av免费 | 免费观看av网址 | 亚洲a一区二区 | 亚洲福利一区二区三区 | 91国内精品野花午夜精品 | 亚洲成人黄色在线观看 | 女警白嫩翘臀呻吟迎合 | 麻豆成人入口 | 免费在线观看视频 | 富二代成人短视频 | 91精品又粗又猛又爽 | 日本人和亚洲人zjzjhd | 成人在线视频免费观看 | 欧美激情一二三区 | 中文资源在线观看 | av美女网站 | 岛国二区| 国产小视频在线观看免费 | 森泽佳奈在线播放 | 国产精品自拍偷拍 | 欧美绿帽交换xxx | 天天av综合| av资源网在线观看 | 欧美一级性生活视频 | 午夜精品久久久内射近拍高清 | 不卡一区二区在线观看 | 午夜精品一区 |