python 数组升序_python简单数据清洗和分析
利用python學習了簡單一維數(shù)組和二維數(shù)組,明白了集合、數(shù)組、字典大概的關(guān)聯(lián),并學會從中點用不同的數(shù)組類型進行更好的分析。
讀取excel文件,開始進行最簡單的數(shù)據(jù)清洗。
將購藥時間重新命名為銷售時間,即python可以實現(xiàn)對列名稱進行更換。
因為最開始引用的數(shù)據(jù)格式全部為文本格式,現(xiàn)在需要將銷售數(shù)據(jù)、應(yīng)收金額、實收金額轉(zhuǎn)換為浮點數(shù)據(jù)進行運算。
還需要進行一步:對數(shù)據(jù)表中的空值進行刪除,以便后續(xù)處理。
函數(shù)的那一步意義為:將銷售時間‘2018-01-01 星期五’用split函數(shù)進行分列,提取分析所需的信息,即‘2018-01-01’。其中用到了for循環(huán)和自定義函數(shù)。
然后將銷售時間數(shù)據(jù)的格式轉(zhuǎn)換為日期格式,便于進一步的統(tǒng)計分析。(注意:在這一步的時候可能會出現(xiàn)日期格式數(shù)據(jù)出現(xiàn)控制,所以需要將空值進行刪除)
在完成數(shù)據(jù)格式轉(zhuǎn)換以后,用file.dtypes可以看到每一列的數(shù)據(jù)格式。
接下來將數(shù)據(jù)按照銷售時間的升序排列。
數(shù)據(jù)清洗完成后,可以開始數(shù)據(jù)分析或者數(shù)據(jù)運算。
這里用到了分組功能,因之前已經(jīng)把銷售時間數(shù)據(jù)變?yōu)榱巳掌跀?shù)據(jù),所以可以根據(jù)月份分類,直接可以顯示各個月份的銷售數(shù)量、應(yīng)收、實收金額。
應(yīng)用以上內(nèi)容,我將針對某微信公眾號在2019年的數(shù)據(jù)進行簡單統(tǒng)計分析。首先導(dǎo)入excel文件。
刪除空值,將閱讀量、當日漲、掉粉量和分享量的數(shù)據(jù)轉(zhuǎn)為浮點型,把日期數(shù)據(jù)轉(zhuǎn)為日期格式。
根據(jù)每個月的閱讀量、分享量、當日漲粉、掉粉情況進行統(tǒng)計,并計算了2019年總的閱讀量。
根據(jù)以上的學習,大概了解了用python清洗數(shù)據(jù)的過程,可以類比excel來想。在excel中可能運用數(shù)據(jù)透視表就可以很簡單運行的東西,在python中對應(yīng)的相對較復(fù)雜的變成語句,這個時候可以結(jié)合自己的熟練程度,進行不同軟件的選擇。在統(tǒng)計分析方面,python有固定的格式,可能以后會學到不同的語句。
在python語句運行中,需要特別小心,可能前一個語句重復(fù)運行盡毀導(dǎo)致下一個語句的無法運行,要更加細心。
總結(jié)
以上是生活随笔為你收集整理的python 数组升序_python简单数据清洗和分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 复仇者联盟4在啥时候上映?
- 下一篇: mysql8导入 psc 没有数据_新特