CSV文件
參考VOC格式轉(zhuǎn)CSV - 云+社區(qū) - 騰訊云
CSV文件:Comma-Separated Values,中文叫,逗號分隔值或者字符分割值,其文件以純文本的形式存儲表格數(shù)據(jù)。該文件是一個字符序列,可以由任意數(shù)目的記錄組成,記錄間以某種換行符分割。每條記錄由字段組成,字段間的分隔符是其他字符或者字符串。所有的記錄都有完全相同的字段序列,相當(dāng)于一個結(jié)構(gòu)化表的純文本形式。
用文本文件、EXcel或者類似與文本文件的都可以打開CSV文件。
在爬蟲中,可以把數(shù)據(jù)寫入CSV文件,示例如下:
import csv #需要導(dǎo)入庫 with open('data.csv','w') as fp:writer = csv.writer(fp)#先傳入文件句柄writer.writerow(['id','name','age'])#然后寫入writer.writerow(['10001','mike','20'])#按行寫入writer.writerow(['10002','Bob','22'])writer.writerow(['10003','Jordan','21'])???????????????
如果想修改列與列之間的分隔符,傳入delimiter參數(shù):
import csv #需要導(dǎo)入庫 with open('data.csv','w') as fp:writer = csv.writer(fp,delimiter = '*')#delimiter只能是一個字節(jié)的字符writer.writerow(['id','name','age'])#然后寫入writer.writerow(['10001','mike','20'])#按行寫入writer.writerow(['10002','Bob','22'])writer.writerow(['10003','Jordan','21'])?????????
也可以先寫標(biāo)題,在寫數(shù)據(jù):
注意:數(shù)據(jù)是一個列表,并且用writerows()方法
一般情況下,爬蟲的數(shù)據(jù)以字典居多:
import csv with open('data.csv','w') as fp:fieldnames = ['id','name','age'] #先定義字典里的key#用DictWriter()方法,增加一個fieldnameswriter = csv.DictWriter(fp,fieldnames = fieldnames,delimiter = '+') writer.writeheader()#先寫入key#按照字典的方式寫入writer.writerow({ 'id':'10001','name':'mike','age':'20'})writer.writerow({ 'id':'10002','name':'Bob','age':'22'})writer.writerow({ 'id':'10003','name':'Jordan','age':'21'})??????????????
讀取CSV文件由兩種方式:
(1)第一種
(2)第二種
import pandas as pd #需要導(dǎo)入pandas庫 df = pd.read_csv('data.csv') print(df)總結(jié)
- 上一篇: 360U盘杀毒并防止文件丢失
- 下一篇: 基因数据处理114之BWA建立全基因组索