txt如何转成tsv文件
生活随笔
收集整理的這篇文章主要介紹了
txt如何转成tsv文件
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
首先區別這三個:
- csv文件,每一行中不同的數據用逗號分開, 不包含空格。
- tsv文件,分隔符號是‘\t’ 而不是csv中的逗號。
我是用的笨方法,先轉成csv文件,再轉成tsv。有其他更好用的方法可以交流
// txt to csv import csv csvFile = open("dev2.csv",'w',newline='',encoding='utf-8') // 我的數據是中文數據集,所以用utf-8 writer = csv.writer(csvFile) csvRow = []f = open("dev.txt",'r',encoding='utf8') for line in f:csvRow = line.split()writer.writerow(csvRow) f.close() csvFile.close()# 由于在txt中也包含了空格,所以得到的csv文件是根據空格劃分的。 # 我的數據集的格式分成了兩部分: (一個中文短句:string, 一個標簽:int),但是短句中包括了空格,所以這樣變換會分成三個或者更多個部分。# 所以改進代碼,將list中的前[:-1]個合并成一個部分。 # 改進后代碼如下: import csv csvFile = open("dev2.csv",'w',newline='',encoding='utf-8') writer = csv.writer(csvFile) csvRow = []f = open("dev.txt",'r',encoding='utf8') for line in f:csvRow = line.split()temp_label = csvRow.pop() # 得到最后一個元素csvRow = ["".join(csvRow),temp_label] # join合并元素print(csvRow)writer.writerow(csvRow) f.close() csvFile.close()# # 轉成tsv文件 with open('dev2.csv',encoding='utf-8') as f:data = f.read().replace(',', '\t') with open('dev.tsv','w',encoding='utf-8') as f:f.write(data) f.close()?
總結
以上是生活随笔為你收集整理的txt如何转成tsv文件的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: totoro框架 入门
- 下一篇: 各种深度聚类方法摘要