dir
=
r
'D:\caffe-gpu\caffe-windows\examples\char_wt\char-trainset-0724'
rate
=
0.1
if
__name__
==
'__main__'
:
trainpath
=
dir
+
"\\train"
for
file
in
os
.
listdir
(
trainpath
)
:
filepath
=
os
.
path
.
join
(
trainpath
,
file
)
files
=
os
.
listdir
(
filepath
)
filelength
=
len
(
files
)
print
(
"filelength = %d "
%
filelength
)
picklength
=
int
(
filelength
*
rate
)
sample
=
random
.
sample
(
files
,
picklength
)
print
(
"len-sample = %d "
%
len
(
sample
)
)
list
=
filepath
.
split
(
"\\"
)
valpath
=
dir
+
"\\val\\"
+
str
(
list
[
len
(
list
)
-
1
]
)
isExists
=
os
.
path
.
exists
(
valpath
)
if
not
isExists
:
os
.
makedirs
(
valpath
)
for
name
in
sample
:
shutil
.
move
(
os
.
path
.
join
(
filepath
,
name
)
,
os
.
path
.
join
(
valpath
,
name
)
)
import os, random, shutil#将 dir 目录下 train 中的各个文件夹中的文件随机移动到 dir 创建的 val 同名目录dir = r'D:\caffe-gpu\caffe-windows\examples\char_wt\char-trainset-0724'rate = 0.1 #选取的比例if __name__ == '__main__': ...
文字识别时候,大量
图片
.jpg还有配套的文本文档.txt人工进行筛选太麻烦,还有可能存在
图片
丢失文档的情况,这些问题可以用
python
代码简单搞定,还可以按照喜欢的比例分配
训练
集和
测试
集:yiyishang
#!/usr/bin/env
python
# -*- coding:utf-8 -*-
#coco
import os
import random
import shutil
def movefile(filedir,tardir):
pathdir=os.list...
imgpath = 'G:/1/img/' #
图片
所在文件夹
xmlpath = 'G:/1/xml/' # xml文件所在文件夹
trainpath = 'G:/1/train/' # 划分后的
训练
集的保存路径
testpath = 'G:/1/test/' # 划分后的
测试
集的保存路径
imgnames = [] #
图片
列表
xmlnames = [] # xml文件列表
# 获取所有的
import os, random, shutil
def moveFile(fileDir):
pathDir = os.listdir(fileDir) #取
图片
的原始路径
filenumber=len(pathDir)
picknumber=900 #按照rate比例从文件夹
中
取一定数量
图片
sam...
(3)观察用于模型
训练
数据的分布
1 def load_data(file_name, sample_ratio=1, n_class=15, names=names, one_hot=True):
2 '''load data from .csv file'''
随机
生成
训练
集和
测试
集
代码在
图片
目录上一层目录运行,设
图片
目录
中
每张
图片
都有xml或txt格式的标记文件。
# -*- coding: UTF-8 -*-
# import xml.etree.ElementTree as ET
import os
import random
if __name__ == "__main__":
wd = os.getcwd() # 获取当前文件目录
dir_list = os.listdir(wd)
dir_pic = []
def all_file_path(dir):
all_path = []
pth = os.path.abspath(os.path.dirname(__file__) + '/' + dir)
# 假设你有一个
图片
文件夹,里面有多个
图片
文件
images = ['image1.jpg', 'image2.jpg', 'image3.jpg', 'image4.jpg', 'image5.jpg']
# 使用random.choice从列表
中
随机
选择一张
图片
select...