Python等比例缩放图片并修改对应的Labelme标注文件(v2.0)

2023-12-16 04:51:06

在这里插入图片描述

前言

前提条件

相关介绍

  • Python是一种跨平台的计算机程序设计语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。
  • Python OS模块是负责程序与操作系统的交互,提供了访问操作系统底层的接口和非常丰富的方法用来处理文件和目录。
  • PyTorch 是一个深度学习框架,封装好了很多网络和深度学习相关的工具方便我们调用,而不用我们一个个去单独写了。它分为 CPU 和 GPU 版本,其他框架还有 TensorFlow、Caffe 等。PyTorch 是由 Facebook 人工智能研究院(FAIR)基于 Torch 推出的,它是一个基于 Python 的可续计算包,提供两个高级功能:1、具有强大的 GPU 加速的张量计算(如 NumPy);2、构建深度神经网络时的自动微分机制。
  • YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。它是一个在COCO数据集上预训练的物体检测架构和模型系列,代表了Ultralytics对未来视觉AI方法的开源研究,其中包含了经过数千小时的研究和开发而形成的经验教训和最佳实践。
  • Labelme是一款图像标注工具,由麻省理工(MIT)的计算机科学和人工智能实验室(CSAIL)研发。它是用Python和PyQT编写的,开源且免费。Labelme支持Windows、Linux和Mac等操作系统。
  • 这款工具提供了直观的图形界面,允许用户在图像上标注多种类型的目标,例如矩形框、多边形、线条等,甚至包括更复杂的形状。标注结果以JSON格式保存,便于后续处理和分析。这些标注信息可以用于目标检测、图像分割、图像分类等任务。
  • 总的来说,Labelme是一款强大且易用的图像标注工具,可以满足不同的图像处理需求。
  • Labelme标注json文件是一种用于存储标注信息的文件格式,它包含了以下几个主要的字段:
    • version: Labelme的版本号,例如"4.5.6"。
    • flags: 一些全局的标志,例如是否是分割任务,是否有多边形,等等。
    • shapes: 一个列表,每个元素是一个字典,表示一个标注对象。每个字典包含了以下几个字段:
      • label: 标注对象的类别名称,例如"dog"。
      • points: 一个列表,每个元素是一个坐标对,表示标注对象的边界点,例如[[10, 20], [30, 40]]。
      • group_id: 标注对象的分组编号,用于表示属于同一组的对象,例如1。
      • shape_type: 标注对象的形状类型,例如"polygon",“rectangle”,“circle”,等等。
      • flags: 一些针对该标注对象的标志,例如是否是难例,是否被遮挡,等等。
    • lineColor: 标注对象的边界线颜色,例如[0, 255, 0, 128]。
    • fillColor: 标注对象的填充颜色,例如[255, 0, 0, 128]。
    • imagePath: 图像文件的相对路径,例如"img_001.jpg"。
    • imageData: 图像文件的二进制数据,经过base64编码后的字符串,例如"iVBORw0KGgoAAAANSUhEUgAA…"。
    • imageHeight: 图像的高度,例如600。
    • imageWidth: 图像的宽度,例如800。

以下是一个Labelme标注json文件的示例:

{
  "version": "4.5.6",
  "flags": {},
  "shapes": [
    {
      "label": "dog",
      "points": [
        [
          121.0,
          233.0
        ],
        [
          223.0,
          232.0
        ],
        [
          246.0,
          334.0
        ],
        [
          121.0,
          337.0
        ]
      ],
      "group_id": null,
      "shape_type": "polygon",
      "flags": {}
    }
  ],
  "lineColor": [
    0,
    255,
    0,
    128
  ],
  "fillColor": [
    255,
    0,
    0,
    128
  ],
  "imagePath": "img_001.jpg",
  "imageData": "iVBORw0KGgoAAAANSUhEUgAA...",
  "imageHeight": 600,
  "imageWidth": 800
}

实验环境

  • Python 3.x (面向对象的高级语言)

Python等比例缩放图片并修改对应的Labelme标注文件

Json文件

{
    "version":"5.0.1",
    "flags":{

    },
    "shapes":[
        {
            "label":"1",
            "points":[
                [
                    551.3333333333339,
                    17
                ],
                [
                    1144.666666666667,
                    843.6666666666667
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"1",
            "points":[
                [
                    206.48387096774195,
                    1022.5806451612904
                ],
                [
                    111,
                    0
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"1",
            "points":[
                [
                    2364.666666666667,
                    17
                ],
                [
                    2704.666666666667,
                    1823.666666666667
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"1",
            "points":[
                [
                    698.272727272727,
                    3475.818181818182
                ],
                [
                    1167.759862778731,
                    841.8233276157805
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"1",
            "points":[
                [
                    293.1515151515159,
                    4000.818181818181
                ],
                [
                    707.363636363636,
                    848.5454545454545
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"4",
            "points":[
                [
                    109.70967741935465,
                    1025.8064516129032
                ],
                [
                    193.58064516129025,
                    2103.2258064516127
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"1",
            "points":[
                [
                    1895.3243243243242,
                    13.513513513513514
                ],
                [
                    2360.189189189189,
                    1208.1081081081081
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"1",
            "points":[
                [
                    1654.7837837837842,
                    710.8108108108108
                ],
                [
                    2351.7692307692305,
                    3007.6923076923076
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        }
    ],
    "imagePath":"1.jpg",
    "imageData":null,
    "imageHeight":4000,
    "imageWidth":8320
}

代码实现

import os
import cv2
import json

def resize_img_equal_proportion(in_img_path,out_img_path,resized_pix):
    '''
    in_img_path:图片输入路径
    out_img_path:图片结果保存路径
    resized_pix: 缩放后分辨率
    '''
    ori_img = cv2.imread(in_img_path) # 读取图片
    print(ori_img.shape)
    height, width = ori_img.shape[:2] # 原始分辨率
    # 等比例缩放到pix=400
    scale = resized_pix / height
    # 缩放后分辨率
    resized_height = resized_pix 
    resized_width = int(width * scale)
    img = cv2.resize(ori_img, (resized_width, resized_height))
    print(img.shape)
    cv2.imwrite(out_img_path, img)
    return resized_height,resized_width,scale

def alter_json_equal_proportion(img_name,in_json_path,out_json_path,resized_height,resized_width,scale):
    '''
    in_json_path: json文件输入路径
    out_json_path: json文件保存路径
    resized_height: 缩放后的高
    resized_width: 缩放后的宽
    scale: 图片缩放比例
    '''
    file_in = open(in_json_path, "r", encoding='utf-8')
    # json.load数据到变量json_data
    json_data = json.load(file_in)
    # 修改json中的内容
    json_data["imageHeight"] = resized_height
    json_data["imageWidth"] = resized_width
    json_data["imagePath"] = img_name
    for LabelBox in json_data['shapes']:
        for point in LabelBox['points']:
            point[0] = point[0]*scale
            point[1] = point[1]*scale
        
    file_in.close()

    # 创建一个写文件
    file_out = open(out_json_path, "w", encoding='utf-8')
    # 将修改后的数据写入文件
    file_out.write(json.dumps(json_data))
    file_out.close()



if __name__ =="__main__":
    in_img_dir = 'images/'
    in_json_dir = 'jsons/'
    
    out_dir_name = 'output/'

    if not os.path.exists(out_dir_name):
        os.mkdir(out_dir_name)

    img_name_list = os.listdir(in_img_dir)
    # print(img_name_list)
    
    json_name_list = os.listdir(in_json_dir)
    # print(json_name_list)

    img_list  = [i for i in img_name_list if i.endswith('.jpg') or i.endswith('.bmp') or i.endswith('.png') ] 
    # print(img_list)

    json_list = [i for i in json_name_list if i.endswith('.json')]
    # print(json_list)


    for img_name in img_list:
        try:
            # print(img_name)
        
            in_img_path =in_img_dir +  img_name # 获取文件路径
            in_json_path = in_json_dir + img_name[:-4]+'.json'

            out_img_path = out_dir_name +  img_name
            out_json_path = out_dir_name + img_name[:-4]+'.json'
            print(out_img_path,out_json_path)
            
            if os.path.exists(in_json_path): # 输入图片所对应的json文件存在,则为True。
                resized_height,resized_width,scale = resize_img_equal_proportion(in_img_path,out_img_path,resized_pix=2048)
                alter_json_equal_proportion(img_name,in_json_path,out_json_path,resized_height,resized_width,scale)
        
        except Exception as e:
            print(e)

输出结果

{
    "version":"5.0.1",
    "flags":{

    },
    "shapes":[
        {
            "label":"1",
            "points":[
                [
                    141.14133333333348,
                    4.352
                ],
                [
                    293.03466666666674,
                    215.9786666666667
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"1",
            "points":[
                [
                    52.85987096774194,
                    261.78064516129035
                ],
                [
                    28.416,
                    0
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"1",
            "points":[
                [
                    605.3546666666667,
                    4.352
                ],
                [
                    692.3946666666668,
                    466.85866666666675
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"1",
            "points":[
                [
                    178.75781818181812,
                    889.8094545454546
                ],
                [
                    298.94652487135517,
                    215.5067718696398
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"1",
            "points":[
                [
                    75.04678787878808,
                    1024.2094545454543
                ],
                [
                    181.08509090909084,
                    217.22763636363635
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"4",
            "points":[
                [
                    28.08567741935479,
                    262.60645161290324
                ],
                [
                    49.556645161290305,
                    538.4258064516129
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"1",
            "points":[
                [
                    485.203027027027,
                    3.4594594594594597
                ],
                [
                    604.2084324324325,
                    309.2756756756757
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        },
        {
            "label":"1",
            "points":[
                [
                    423.62464864864876,
                    181.96756756756758
                ],
                [
                    602.052923076923,
                    769.9692307692308
                ]
            ],
            "group_id":null,
            "shape_type":"rectangle",
            "flags":{

            }
        }
    ],
    "imagePath":"1.jpg",
    "imageData":null,
    "imageHeight":1024,
    "imageWidth":841
}

文章来源:https://blog.csdn.net/FriendshipTang/article/details/135019375
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。