山高水长
首页
  • 分类
  • 标签
  • 归档
友情链接
GitHub (opens new window)

山高水长

首页
  • 分类
  • 标签
  • 归档
友情链接
GitHub (opens new window)
  • Python 打印表格
  • PyTorch广播机制
  • shell脚本
  • 数据集可视化
  • 目标检测数据集分析
    • 图片数量、标注框数量、类别信息
    • 所有图片宽度和高度的散点图
    • 所有标注框宽度和高度的散点图
    • 标注框宽度和高度之比
    • 每一类的标注框数量
    • 每一类图片数量
    • 每一张图片上的标注框数量
    • 不同尺寸的图片数量
    • 每一类标注框的宽度高度散点图
    • 使用方法
      • Install
      • Usage
      • Example
  • PyQTt5逻辑和界面分离
  • Python执行终端命令
  • posts
Shanya
2022-05-12
目录

目标检测数据集分析

现在支持导出excel数据,可以使用自己喜欢的软件生成图像了。

# 目标检测数据集分析

平时我们经常需要对我们的数据集进行各种分析,以便我们找到更好的提高方式。所以我将我平时分析数据集的一些方法打包发布在了Github上,分享给大家,有什么错误和意见,请多多指教!
项目地址 (opens new window)

# 图片数量、标注框数量、类别信息

这些信息会在终端打印出来,格式如下:

Processing, please wait...

============ Errors ============

Annotations\helmet_10551.xml Image has wrong height and width.

============ Errors ============


***************** Info *****************

number of images: 43677
number of boxes: 62239
classes =  ['unwear', 'wearing']

***************** Info *****************

Processing completed. The result is saved in out.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

# 所有图片宽度和高度的散点图

这里只有一个点,是因为所有的图片尺寸相同
imageWH

# 所有标注框宽度和高度的散点图

bboxWH

# 标注框宽度和高度之比

横坐标为比率,纵坐标为数量

AnchorBoxRatio

# 每一类的标注框数量

EachCategoryNum

EachCategoryNumPie

# 每一类图片数量

EachCategoryImagesNum

# 每一张图片上的标注框数量

横坐标为一张图片上的标注框数量,纵坐标为图片数量
EachImageBboxNum

# 不同尺寸的图片数量

根据coco的划分规则计算

SizeBboxNum

# 每一类标注框的宽度高度散点图

1WH

2WH

3WH

4WH

# 使用方法

Github (opens new window)

# Install

git clone https://github.com/Shanyaliux/DataAnalyze.git
cd DataAnalyze
pip install -r requirements.txt
1
2
3

# Usage

python analyze.py ${type} ${path} [--out ${out}]
1
  • type The format of the dataset, optional 'coco' or 'voc'.
  • path The path of dataset. If type is 'coco', the path is the json file path. If type is 'voc', the path is the path of the xml file directory.
  • --out is the output directory, default is './out'

# Example

python analyze.py coco ./tarin.json --out ./out/
1
python analyze.py voc ./xml/ --out ./out/
1
编辑 (opens new window)
#posts
上次更新: 2022/09/30, 04:53:04
数据集可视化
PyQTt5逻辑和界面分离

← 数据集可视化 PyQTt5逻辑和界面分离→

最近更新
01
FCOS
09-30
02
Python执行终端命令
09-13
03
Android Compose 权限请求
08-12
更多文章>
Theme by Vdoing | Copyright © 2020-2022 Shanya | MIT License
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式