获取的voc数据集不知道label标注文件共有多少个类别,写了个小脚本,可以获取所有类别数:
把annotation_path 换成标签(xml)文件存放的文件夹:

import xml.dom.minidom as xmldom
import os

#voc数据集获取所有标签的所有类别数"
annotation_path="F:\workspace\database\chonqing_trin_voc\VOC2007\Annotations"

annotation_names=[os.path.join(annotation_path,i) for i in os.listdir(annotation_path)]

labels = list()
for names in annotation_names:
xmlfilepath = names
domobj = xmldom.parse(xmlfilepath)
# 得到元素对象
elementobj = domobj.documentElement
#获得子标签
subElementObj = elementobj.getElementsByTagName("object")
for s in subElementObj:
label=s.getElementsByTagName("name")[0].firstChild.data
#print(label)
if label not in labels:
labels.append(label)
print(labels)

运行后即输出所有类别数:

获取voc数据集标签所有的类别数_xml