相关文章推荐
绅士的茴香  ·  安装cplex到python_mob64ca ...·  1 周前    · 
性感的黑框眼镜  ·  PostgreSQL Connector ...·  1 年前    · 
叛逆的沙发  ·  Spring Cloud ...·  1 年前    · 
#将 dir 目录下 train 中的各个文件夹中的文件随机移动到 dir 创建的 val 同名目录 dir = r 'D:\caffe-gpu\caffe-windows\examples\char_wt\char-trainset-0724' rate = 0.1 #选取的比例 if __name__ == '__main__' : trainpath = dir + "\\train" for file in os . listdir ( trainpath ) : #print( file) filepath = os . path . join ( trainpath , file ) #每个子文件夹 #print("filepath = %s " % filepath) files = os . listdir ( filepath ) #每个子文件夹的所有文件列表 filelength = len ( files ) print ( "filelength = %d " % filelength ) picklength = int ( filelength * rate ) #print("picklength = %d " % picklength) sample = random . sample ( files , picklength ) #从每个子文件夹中随机选取 print ( "len-sample = %d " % len ( sample ) ) list = filepath . split ( "\\" ) valpath = dir + "\\val\\" + str ( list [ len ( list ) - 1 ] ) #print("valpath = %s"%valpath) isExists = os . path . exists ( valpath ) if not isExists : os . makedirs ( valpath ) for name in sample : #print("name = %s"%name) shutil . move ( os . path . join ( filepath , name ) , os . path . join ( valpath , name ) ) import os, random, shutil#将 dir 目录下 train 中的各个文件夹中的文件随机移动到 dir 创建的 val 同名目录dir = r'D:\caffe-gpu\caffe-windows\examples\char_wt\char-trainset-0724'rate = 0.1 #选取的比例if __name__ == '__main__': ...
文字识别时候,大量 图片 .jpg还有配套的文本文档.txt人工进行筛选太麻烦,还有可能存在 图片 丢失文档的情况,这些问题可以用 python 代码简单搞定,还可以按照喜欢的比例分配 训练 集和 测试 集:yiyishang #!/usr/bin/env python # -*- coding:utf-8 -*- #coco import os import random import shutil def movefile(filedir,tardir): pathdir=os.list...
imgpath = 'G:/1/img/' # 图片 所在文件夹 xmlpath = 'G:/1/xml/' # xml文件所在文件夹 trainpath = 'G:/1/train/' # 划分后的 训练 集的保存路径 testpath = 'G:/1/test/' # 划分后的 测试 集的保存路径 imgnames = [] # 图片 列表 xmlnames = [] # xml文件列表 # 获取所有的 import os, random, shutil def moveFile(fileDir): pathDir = os.listdir(fileDir) #取 图片 的原始路径 filenumber=len(pathDir) picknumber=900 #按照rate比例从文件夹 取一定数量 图片 sam... (3)观察用于模型 训练 数据的分布 1 def load_data(file_name, sample_ratio=1, n_class=15, names=names, one_hot=True): 2 '''load data from .csv file'''
随机 生成 训练 集和 测试 集 代码在 图片 目录上一层目录运行,设 图片 目录 每张 图片 都有xml或txt格式的标记文件。 # -*- coding: UTF-8 -*- # import xml.etree.ElementTree as ET import os import random if __name__ == "__main__": wd = os.getcwd() # 获取当前文件目录 dir_list = os.listdir(wd) dir_pic = [] def all_file_path(dir): all_path = [] pth = os.path.abspath(os.path.dirname(__file__) + '/' + dir) # 假设你有一个 图片 文件夹,里面有多个 图片 文件 images = ['image1.jpg', 'image2.jpg', 'image3.jpg', 'image4.jpg', 'image5.jpg'] # 使用random.choice从列表 随机 选择一张 图片 select...