生活随笔
收集整理的這篇文章主要介紹了
python观察日志(part28)--数据的加载与存储
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
學習筆記,僅供參考,有錯必究
參考文獻:編碼問題:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb3 in position;
數據的加載與存儲
文本文件的加載與存儲
import numpy
as np
import matplotlib
.pyplot
as plt
from IPython
.core
.interactiveshell
import InteractiveShell
InteractiveShell
.ast_node_interactivity
= 'all'
plt
.rcParams
['font.sans-serif']=['SimHei']
plt
.rcParams
['axes.unicode_minus']=False
讀取csv文件
import pandas
as pd
data
= pd
.read_csv
('./data/test.csv', encoding
='gb18030')
data
.head
()
城市人均地區生產總值(元)第三產業占GDP比重人均地方財政收入對外貿易系數
0| 上海 | 78989 | 59.36 | 18135.913470 | 1.292077 |
1| 南京市 | 67455 | 51.31 | 6899.471236 | 0.558394 |
2| 無錫市 | 107365 | 41.30 | 8931.908085 | 0.615872 |
3| 徐州市 | 25100 | 37.29 | 1716.189263 | 0.065778 |
4| 常州市 | 70138 | 39.62 | 5999.911067 | 0.418762 |
data
= pd
.read_csv
('./data/test.csv', encoding
='gb18030', skiprows
=[1])
data
.head
()
城市人均地區生產總值(元)第三產業占GDP比重人均地方財政收入對外貿易系數
0| 南京市 | 67455 | 51.31 | 6899.471236 | 0.558394 |
1| 無錫市 | 107365 | 41.30 | 8931.908085 | 0.615872 |
2| 徐州市 | 25100 | 37.29 | 1716.189263 | 0.065778 |
3| 常州市 | 70138 | 39.62 | 5999.911067 | 0.418762 |
4| 蘇州市 | 122565 | 39.41 | 11766.805100 | 1.821834 |
data
= pd
.read_csv
('./data/test.csv', encoding
='gb18030', sep
= ',')
data
.head
()
城市人均地區生產總值(元)第三產業占GDP比重人均地方財政收入對外貿易系數
0| 上海 | 78989 | 59.36 | 18135.913470 | 1.292077 |
1| 南京市 | 67455 | 51.31 | 6899.471236 | 0.558394 |
2| 無錫市 | 107365 | 41.30 | 8931.908085 | 0.615872 |
3| 徐州市 | 25100 | 37.29 | 1716.189263 | 0.065778 |
4| 常州市 | 70138 | 39.62 | 5999.911067 | 0.418762 |
data
= pd
.read_csv
('./data/test.csv', encoding
='gb18030', names
= ['city', 'a', 'b', 'c', 'd'])
data
.head
()
cityabcd
0| 城市 | 人均地區生產總值(元) | 第三產業占GDP比重 | 人均地方財政收入 | 對外貿易系數 |
1| 上海 | 78989 | 59.36 | 18135.91347 | 1.292076869 |
2| 南京市 | 67455 | 51.31 | 6899.471236 | 0.558393574 |
3| 無錫市 | 107365 | 41.3 | 8931.908085 | 0.615871884 |
4| 徐州市 | 25100 | 37.29 | 1716.189263 | 0.065778095 |
存儲csv文件
df
= pd
.DataFrame
(np
.array
(range(12)).reshape
((6, 2)), columns
= ['A', 'B'])
df
.to_csv
('./output/test_output.csv')
df
.to_csv
('./output/test_output2.csv', '|')
除了讀取csv文件以外,還可以通過read_json(),read_html等方式讀取json,html等文件;to_json(),to_html()等方式寫出json,html等文件.
Excel表格
讀取Excel文件
data1
= pd
.read_excel
("./data/test_excel.xlsx", 'Sheet1')
excel
= pd
.ExcelFile
("./data/test_excel.xlsx")
data2
= pd
.read_excel
(excel
, "Sheet2")
print("data1: \n", data1
)
print("data2: \n", data2
)
data1: ID Name Age
0 1 Ada 19
1 2 Tim 20
2 3 Huang 21
3 4 Black 22
4 5 Jam 23
5 6 Pick 24
6 7 Julia 25
7 8 Kattle 26
data2: ID Wage
0 1 15000
1 2 12000
2 3 13000
3 4 10000
4 5 3000
5 6 5000
6 7 8000
7 8 9000
寫出Excel文件
data1
= data1
[:5]
data1
data2
= data2
[:6]
data2
excel
= pd
.DataFrame
()
excel
.to_excel
("./output/test_output3.xlsx")
writer
= pd
.ExcelWriter
("./output/test_output3.xlsx")
data1
.to_excel
(writer
, "Sheet1")
data2
.to_excel
(writer
, "Sheet2")
writer
.save
()
IDNameAge
0| 1 | Ada | 19 |
1| 2 | Tim | 20 |
2| 3 | Huang | 21 |
3| 4 | Black | 22 |
4| 5 | Jam | 23 |
IDWage
0| 1 | 15000 |
1| 2 | 12000 |
2| 3 | 13000 |
3| 4 | 10000 |
4| 5 | 3000 |
5| 6 | 5000 |
總結
以上是生活随笔為你收集整理的python观察日志(part28)--数据的加载与存储的全部內容,希望文章能夠幫你解決所遇到的問題。
如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。