python科学计算笔记(二)pandas获取网络文件
生活随笔
收集整理的這篇文章主要介紹了
python科学计算笔记(二)pandas获取网络文件
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
import urllib.requestimport requests
from io import StringIOimport numpy as npimport pandas as pd
'''
下載網絡文件,并導入CSV文件作為numpy的矩陣
'''# 網絡數據文件地址
url = "http://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/pima-indians-diabetes.data"# 方法一
# ========================================================
# 下載文件
#r = urllib.request.urlopen(url)
# 導入CSV文件作為numpy的矩陣
#dataset = np.loadtxt(r, delimiter=",")# 方法二
# ========================================================
# 下載文件
#r = requests.get(url)
# 導入CSV文件作為numpy的矩陣
#dataset = np.loadtxt(StringIO(r.text), delimiter=",") # 此處用到 StringIO !!!!!!# 方法三
# ========================================================
#用genfromtxt直接下載網絡文件,并將CSV文件導作numpy矩陣。爽!!!!!!!!
#dataset = np.genfromtxt(url, delimiter=",")# 方法四
# ========================================================
# 用pandas.read_csv直接下載網絡文件,并將CSV文件導作pandas.DataFrame。
# dataset = pd.read_csv('http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv', index_col=0)
dataset = pd.read_csv(url)# ========================================================
# separate the data from the target attributes
#X = dataset[:,0:7]
#y = dataset[:,8]#print(X)
#print(y)我這里是這樣獲取列數據的:
X = dataset[dataset.columns[0:8]]
y = dataset[dataset.columns[8:9]]print dataset[0:10]
#這里取1到10行的所有數據,而不是列數據
總結
以上是生活随笔為你收集整理的python科学计算笔记(二)pandas获取网络文件的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python学习笔记(十五)标准库Str
- 下一篇: python科学计算笔记(三)panda