當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【记录】Python3｜json文件处理相关的操作

發布時間：2025/5/22 编程问答 53 如意码农

生活随笔收集整理的這篇文章主要介紹了【记录】Python3｜json文件处理相关的操作小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

- json分割
- json.gz 轉換成 jsonl.gz
- json格式化顯示
- 遍歷目錄及子目錄，對某種類型的文件內容查找是否有指定字符串

json分割

主要使用json.loads、json.dump。

import json

# 把path文件分割成num個，并存入path2中

# path: 文件路徑 path2 : 目標路徑 num: 結果的數量

def jsonSplit(path, path2, num):

    count = 0

    for count, line in enumerate(open(path, 'rU', encoding='utf-8')):

        pass

        count += 1

    nums = [(count * i // num) for i in range(1, num + 1)]

    current_lines = 0

    data_list = []

    # 打開大文件，拆成小文件

    with open(path, 'r', encoding='utf-8') as file:

        i = 0

        for line in file:

            # line = line.replace('},','}')

            data_list.append(json.loads(line))

            current_lines += 1

            if current_lines in nums:

                # print(current_lines)

                # 保存文件

                file_name = path2 + str(current_lines) + '.json'

                with open(file_name, 'w', encoding='utf-8') as f:

                    # print(len(data_list))

                    data = json.dumps(data_list)

                    f.write(data)

                    data_list = []

                    data = []

json.gz 轉換成 jsonl.gz

主要使用gzip、jsonlines。

import os

import gzip

import jsonlines

import json

# 把path對應的json.gz文件，轉化成jsonlines文件，再壓縮成jsonl.gz文件

# path：數據集的路徑 path2：結果路徑

def jsonTojsonlGZ(path, path2):

    with gzip.open(path, 'rt') as pf:

        # 加載json

        data = pf.read()

        all_data = json.loads(data)

        # 打開jsonl并寫入

        filename = path2 + '.jsonl'

        with jsonlines.open(filename, mode='a') as writer:

            for item in all_data:

                writer.write(item)

        # 打開jsonl.gz并寫入jsonl文件的內容

        f_gzip = gzip.GzipFile(filename + '.gz', "wb")

        with open(filename, 'rb') as f_in:

            f_gzip.write(f_in.read())

        # 刪除jsonl文件

        os.remove(filename)

json格式化顯示

import json

dic = {'a': 1, 'b': 2, 'c': 3}

js = json.dumps(dic)

print(js)

遍歷目錄及子目錄，對某種類型的文件內容查找是否有指定字符串

# coding:utf-8

import re

import os

import gzip

import sys

file_behind=sys.argv[1]

dirname=sys.argv[2]

tofind=sys.argv[3]

def searchInDir(dirname):

  for root,dirs,files in os.walk(dirname):

    for dir in dirs:

      searchInDir(dir)

    for filename in files:

      if(os.path.splitext(filename)[1]!=file_behind):

        continue

      file=os.path.join(root,filename)

      if(file_behind==".gz"):

        with gzip.open(file,"rt",encoding='utf-8') as f:

          content = f.read()

          print(file, re.findall(tofind,content))

      else:

        with open(file,"rt",encoding='utf-8') as f:

          content = f.read()

          print(file, re.findall(tofind,content))

searchInDir(dirname)

效果：

總結

以上是生活随笔為你收集整理的【记录】Python3｜json文件处理相关的操作的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： 21.7K star！全流程研发项目管理
下一篇：基于Java Swing开发好看的皮肤