机器学习数据导入方法总结
生活随笔
收集整理的這篇文章主要介紹了
机器学习数据导入方法总结
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
1、通過標準Python庫導入CSV文件
? ? ? ? python提供了一個標準類庫CSV,用來處理CSV文件。其中reader()函數(shù)用來讀入CSV.
? ? ? ??
from csv import reader import numpy as np #使用標準的Python類庫導入CSV文件 filename='iris.csv' with open(filename, 'rt') as raw_materials:readers=reader(raw_marerials,delimiter=',')x=list(readers)data=np.array(x).astype('float')print (data.shape)2、通過Numpy導入CSV文件
? ? ? ? ?使用Numpy的loadtxt()函數(shù)導入數(shù)據(jù)。使用這個函數(shù)處理的數(shù)據(jù)沒有文件頭,所有的數(shù)據(jù)結(jié)構(gòu)(數(shù)據(jù)類型,例如:不能有的是float,有的是string)是一樣的。
from numpy import loadtxt filename='iris.csv' with open(filename,'rt') as raw_data:data=loadtxt(raw_data,delimiter=',')print(data.shape)3、通過Pandas導入CSV文件
通過pandas來導入csv文件要使用pandas.read_csv()函數(shù)。這個函數(shù)的返回值是DataFrame,可以方便的進行下一步的處理。這個函數(shù)名非常直觀,便于代碼的閱讀和后續(xù)對數(shù)據(jù)的處理工作。在機器學習項目中,經(jīng)常使用pandas來做數(shù)據(jù)的清洗和數(shù)據(jù)準備工作。
from pandas import read_csv filename='iris.csv' names=['separ-length','separ-width','petal-length','petal-width','class'] dataset=read_csv(filename,names=names) print(dataset.shape)?
總結(jié)
以上是生活随笔為你收集整理的机器学习数据导入方法总结的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Oracle 11g安装步骤(超详细)
- 下一篇: 飞行管理计算机在ATA章节,民航ATA章