1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > CSV多标签数据预处理+加上csv多标签转文件夹+ ISIC数据集分类预处理

CSV多标签数据预处理+加上csv多标签转文件夹+ ISIC数据集分类预处理

时间:2023-11-17 16:58:47

相关推荐

CSV多标签数据预处理+加上csv多标签转文件夹+ ISIC数据集分类预处理

在下小白,深感自己的代码能力太差劲的,真要是大佬,那不是分分钟写出代码;

我这个是准备跑分类网络,有些模型要求分类的数据集必须是文件夹那种类型已经分好了,我找到的是官网的数据集,没有进行数据预处理;

在我处理数据的时候,在网上搜索关于csv针对多标签处理的时候,发现我没找到好用的代码;

在综合好几个博主的代码放在这里,参考的太多了,没时间就不放了;

实测也可以运行

import pandas as pdimport osimport shutil # 读取表格文件+填写你的csv文件的位置f = open(r"D:\PythonProject\dataset\ISIC_Task3_Training_GroundTruth.csv", "rb") list = pd.read_csv(f)# 进行分类----填写你要分类文件夹的标签,有多少就写多少for i in ['NV','DF','AKIEC','VASC','BKL','MEL','BCC']:if not os.path.exists(i):os.mkdir(i)listnew = list[list["type"] == i]#type是你csv文件里面的你要处理的那一列的列名称l = listnew["image"].tolist()#image这里是你的处理文件的名字的列名称j = str(i)for each in l:#这里是你数据文件放置的位置shutil.copy('D:\\PythonProject\\dataset\\ISIC_Task3_Training_Input\\images\\' + each, j)

在这里放上我的数据csv文件的处理的结果

未处理之前的结果:

代码处理之后的结果

顺便把我使用的数据集链接放在这个地方,

ISIC是一个皮肤损伤数据集,包含10,015张图像和七个标签。每个图像都与其中一个标签相关联,形成一个多类分类问题

ISIC Challenge

我是挂tizi进去的,其他网络不清楚

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。