日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【记录】Python3|json文件处理相关的操作

發布時間:2025/5/22 编程问答 53 如意码农
生活随笔 收集整理的這篇文章主要介紹了 【记录】Python3|json文件处理相关的操作 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

    • json分割
    • json.gz 轉換成 jsonl.gz
    • json格式化顯示
    • 遍歷目錄及子目錄,對某種類型的文件內容查找是否有指定字符串

json分割

主要使用json.loads、json.dump。

import json

# 把path文件分割成num個,并存入path2中
# path: 文件路徑 path2 : 目標路徑 num: 結果的數量
def jsonSplit(path, path2, num):
count = 0
for count, line in enumerate(open(path, 'rU', encoding='utf-8')):
pass
count += 1
nums = [(count * i // num) for i in range(1, num + 1)]
current_lines = 0
data_list = []
# 打開大文件,拆成小文件
with open(path, 'r', encoding='utf-8') as file:
i = 0
for line in file:
# line = line.replace('},','}')
data_list.append(json.loads(line))
current_lines += 1
if current_lines in nums:
# print(current_lines)
# 保存文件
file_name = path2 + str(current_lines) + '.json'
with open(file_name, 'w', encoding='utf-8') as f:
# print(len(data_list))
data = json.dumps(data_list)
f.write(data)
data_list = []
data = []

json.gz 轉換成 jsonl.gz

主要使用gzip、jsonlines。

import os
import gzip
import jsonlines
import json # 把path對應的json.gz文件,轉化成jsonlines文件,再壓縮成jsonl.gz文件
# path:數據集的路徑 path2:結果路徑
def jsonTojsonlGZ(path, path2):
with gzip.open(path, 'rt') as pf:
# 加載json
data = pf.read()
all_data = json.loads(data)
# 打開jsonl并寫入
filename = path2 + '.jsonl'
with jsonlines.open(filename, mode='a') as writer:
for item in all_data:
writer.write(item)
# 打開jsonl.gz并寫入jsonl文件的內容
f_gzip = gzip.GzipFile(filename + '.gz', "wb")
with open(filename, 'rb') as f_in:
f_gzip.write(f_in.read())
# 刪除jsonl文件
os.remove(filename)

json格式化顯示

import json

dic = {'a': 1, 'b': 2, 'c': 3}
js = json.dumps(dic)
print(js)

遍歷目錄及子目錄,對某種類型的文件內容查找是否有指定字符串

# coding:utf-8
import re
import os
import gzip
import sys file_behind=sys.argv[1]
dirname=sys.argv[2]
tofind=sys.argv[3] def searchInDir(dirname):
for root,dirs,files in os.walk(dirname):
for dir in dirs:
searchInDir(dir)
for filename in files:
if(os.path.splitext(filename)[1]!=file_behind):
continue
file=os.path.join(root,filename)
if(file_behind==".gz"):
with gzip.open(file,"rt",encoding='utf-8') as f:
content = f.read()
print(file, re.findall(tofind,content))
else:
with open(file,"rt",encoding='utf-8') as f:
content = f.read()
print(file, re.findall(tofind,content)) searchInDir(dirname)

效果:

總結

以上是生活随笔為你收集整理的【记录】Python3|json文件处理相关的操作的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。