Pytorch入门实战（8）：小样本学习实现图片分类（Few-shot ...

相关文章推荐
睿智的酸菜鱼 · 文旅部重新认定国级非遗保护单位，潮州15项花 ...· 1 年前 ·
憨厚的黄瓜 · 喝酒的四个境界除了微醺、酩酊还有什么？_百度知道· 2 年前 ·
爱旅游的红烧肉 · 派早报：Apple Pay 或随 iOS ...· 2 年前 ·
奔跑的创口贴 · Serverless ...· 2 年前 ·
完美的苦瓜 · 镇魂街：皇甫龙斗一共出现3次，每一次出现都有 ...· 2 年前 ·
本文会使用Omniglot数据集训练一个孪生网络（相似网络），其可以用来判断两个图片的相似程度，通过该方式来实现小样本学习。
本文使用Omniglot的训练集来训练神经网络，使用其验证集来构造Support Set。本文会从验证集的每个类别中拿出5个样本作为Support Set，一共挑选10个类别，即为10-way 5-shot的小样本学习。
本文所使用到的环境如下:
python==3.8.5
torch==1.10.2
torchvision==0.11.3
numpy==1.22.3
matplotlib==3.2.2
导入本文需要使用到的包： 
import random
import torch
import torchvision
from torch import nn
from torchvision import transforms
import numpy as np
import matplotlib.pyplot as plt
from tqdm import tqdm
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print("Device:", device)
Device: cuda
加载数据集
 
我们这里使用Pytorch提供的torchvision.datasets.Omniglot的方法来加载数据集。 
 如果你用pytorch下载失败，可以使用百度网盘链接下载，然后解压到当前文件夹下，将download参数改为False即可 
train_dataset = torchvision.datasets.Omniglot('./dataset', background=True, transform=transforms.ToTensor(), download=True)
validation_dataset = torchvision.datasets.Omniglot('./dataset', background=False, transform=transforms.ToTensor(), download=True)
成功加载完数据集后我们来简单看一下： 
image, target = train_dataset.__getitem__(0)
print("image size:", image.size())
print("target:", target)
image size: torch.Size([1, 105, 105])
target: 0
Omniglot数据集都是一张一张的灰度图，和MNIST手写数据集差不多。这个target就是用数字表示的类别，我也不知道对应成实际类别是什么，也不需要知道。 
我们来简单绘制一张看一下： 
plt.imshow(image.squeeze(), cmap='gray')
在孪生网络中，我们一次给到模型的是一对儿图片，然后让模型来区分这对儿图片是否是相同的类别。我们本章就需要来定义这么一个函数，来生成一批样本对儿，其中一半图片对儿是相同类别，另一半图片对儿是不同类别。 
我们首先获取一下训练集中的所有target和所有labels： 
all_targets = np.array([train_dataset.__getitem__(i)[1] for i in range(len(train_dataset))])
all_labels = np.array(list(set(all_targets)))
print("all_targets:", all_targets)
print("all_labels:", all_labels)
all_targets: [  0   0   0 ... 963 963 963]
all_labels: [  0   1   2 ... 959 960 961 962 963]
准备好了这两个基础数据，我们就可以来构造我们的Sample函数了。其作用就是返回一个batch的图片对儿，其中一半是相同的类别，称为正样本，另一半是不同的类别，称为负样本。 
def sample_batch(batch_size):
    从train_dataset中sample一些数据对。一半正样本，一半负样本
    # 选取二分之一个batch的labels作为正样本，这样就完成了正样本的构造。
    positive_labels = np.random.choice(all_labels, batch_size // 2)
    # 针对这些labels，每个选取两张相同类别的图片
    batch = []
    for label in positive_labels:
        labels_indexes = np.argwhere(all_targets == label)
        pair = np.random.choice(labels_indexes.flatten(), 2)
        batch.append((pair[0], pair[1], 1)) # 图片类别相同，所以target为1
    # 选取负样本，这次选取一个batch的labels，然后每个labels个选取一张图片。这样就完成了负样本的构造。
    negative_labels = np.random.choice(all_labels, batch_size)
    for sample1, sample2 in negative_labels.reshape(-1, 2):
        sample1 = np.random.choice(np.argwhere(all_targets == sample1).flatten(), 1)
        sample2 = np.random.choice(np.argwhere(all_targets == sample2).flatten(), 1)
        batch.append((sample1.item(), sample2.item(), 0)) # 图片类别不相同，所以target为0
    完成上面的动作后，最终得到的batch如下：
        (734, 736, 1),
        (127, 132, 1),
        (859, 173, 0),
    其中前两个表示样本对对应在dataset中的index，1表示前两个样本是相同类别。0表示这两个样本为不同类别。
    接下来需要对其进行shuffle处理，然后从dataset中获取到对应数据，最终组成batch.
    random.shuffle(batch)
    sample1_list = []
    sample2_list = []
    target_list = []
    for sample1, sample2, target in batch:
        sample1_list.append(train_dataset.__getitem__(sample1)[0])
        sample2_list.append(train_dataset.__getitem__(sample2)[0])
        target_list.append(target)
    sample1 = torch.stack(sample1_list)
    sample2 = torch.stack(sample2_list)
    targets = torch.LongTensor(target_list)
    return sample1, sample2, targets
完成sample函数后，我们来简单试一下： 
sample1, sample2, targets = sample_batch(16)
print("sample1:", sample1.size())
print("sample2:", sample1.size())
print("targets:", targets)
sample1: torch.Size([16, 1, 105, 105])
sample2: torch.Size([16, 1, 105, 105])
targets: tensor([1, 1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1])
其中sample1[0]和smaple2[0] 是一对儿，targets[0]是它们的标签，表示它们是否是相同类别。 
准备好数据后，我们接下来开始构建模型： 
我们需要构建的模型也很简单，模型的功能就是输入两张图片，输出这两张图片是否为同一个类别。由于是二分类问题，所以我们最后的值通过Sigmoid处理一下： 
class SimilarityModel(nn.Module):
    def __init__(self):
        super(SimilarityModel, self).__init__()
        # 定义一个卷积层，用于特征提取。
        self.conv = nn.Sequential(
            nn.Conv2d(1, 4, kernel_size=3),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2)




    
,
            nn.Conv2d(4, 16, kernel_size=3),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2),
            nn.Conv2d(16, 32, kernel_size=3),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2),
            nn.Conv2d(32, 32, kernel_size=3),
            nn.ReLU(),
        # 定义一个线性层，用来判断两张图片是否为同一类别
        self.sim = nn.Sequential(
            nn.Flatten(),
            nn.Linear(2592, 256),
            nn.ReLU(),
            nn.Linear(256, 1),
            nn.Sigmoid()
    def forward(self, sample1, sample2):
        # 使用卷积层提取sample1的特征
        sample1_features = self.conv(sample1)
        # 使用卷积层提取sample2的特征
        sample2_features = self.conv(sample2)
        # 将 |sample1-sample2| 的结果送给线性层，判断它们的相似度。
        return self.sim(torch.abs(sample1_features - sample2_features))
model = SimilarityModel()
model = model.to(device)
模型定义完后，我们来简单的尝试一下： 
model(sample1.to(device), sample2.to(device))
tensor([[0.5004],
        [0.5005],
        [0.5003],
        [0.5005],
        [0.5000],
        [0.5002],
        [0.5003],
        [0.5000],
        [0.5002]], device='cuda:0', grad_fn=<SigmoidBackward0>)
可以看到，由于模型还未训练，所以输出的值都在50%左右。 
接下来开始训练模型，和普通的二分类问题差别不算很大。 
model = model.train()
criteria = nn.BCELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=1e-4)
batch_size = 512
# 如果500次迭代loss都没有下降，那么就停止训练
early_stop = 1500
# 记录最小的一次loss值
min_loss = 100.
# 记录下上一次最小的loss是哪一次
last_episode = 0
# 无线更新参数，直到loss不再下降为止
for episode in range(100000):
    # 使用sample_batch函数sample出一组数据，包含一半正样本，一半负样本
    sample1, sample2, targets = sample_batch(batch_size)
    # 将数据送入模型，判断是否为同一类别
    outputs = model(sample1.to(device), sample2.to(device))
    # 将模型的结果丢给BCELoss计算损失
    loss = criteria(outputs.flatten(), targets.to(device).float())
    loss.backward()
    # 更新模型参数
    optimizer.step()
    optimizer.zero_grad()
    # 如果本次损失比之前的小，那么记录一下
    if loss < min_loss:
        min_loss = loss.item()
        last_episode = episode
        torch.save(model, 'best_model.pt')
    # 如果连续{early_stop}次loss都没有减小，那么就停止训练
    if episode - last_episode > early_stop:
        break
    # 每50个episode打印一下日志
    if episode % 50 ==  0:
        print(f"episode {episode}, loss {loss}")
print("Finish Training.")
episode 0, loss 0.6931208372116089
episode 50, loss 0.6730687618255615
episode 100, loss 0.6514454483985901
episode 150, loss 0.6112750768661499
episode 2600, loss 0.22310321033000946
episode 2650, loss 0.24409082531929016
episode 2700, loss 0.3104301393032074
验证前先加载一下之前最好的模型： 
model = torch.load('best_model.pt')
model = model.to(device)
接下来我们来验证下我们模型的表现。我们使用上面构造好的validation_dataset。在validation_dataset中，全都是模型之间没有见过的类别，可不是没有见过的图片哦，连这个类别它都没有见过。不信你可以到dataset/images_evaluation这个目录下表看看那。 
我们先来看下验证集中的类别情况： 
all_targets = np.array([validation_dataset.__getitem__(i)[1] for i in range(len(validation_dataset))])
all_labels = np.array(list(set(all_targets)))
print("sample size:", len(all_targets))
print("all_targets:", all_targets)
print("all_labels:", all_labels)
sample size: 13180
all_targets: [  0   0   0 ... 658 658 658]
all_labels: [  0   1   2   3  ... 655 656 657 658]
可以看到，在验证集中我们一共有13180个数据，有658个类别，每个类别有20个样本。我们为每个类别选取5个样本作为support set供模型参考，剩下的15个作为验证集来验证模型的表现。 
如果对这658个类别全部都做预测的话，相当于我们的任务是一个658-way 5-shot的任务。这样不仅预测过程会非常慢，并且准确率也会非常低，所以上面的简单模型就应付不了了。为了简单期间，我们这里裁剪一下，就使用10个类别来验证我们的模型： 
all_targets = all_targets[all_targets < 10]
all_labels = all_labels[:10]
print("sample size:", len(all_targets))
print("all_targets:", all_targets)
print("all_labels:", all_labels)
sample size: 200
all_targets: [0 0 0 0 0 0 0 0 .... 9 9 9 9 9 9]
all_labels: [0 1 2 3 4 5 6 7 8 9]
support_set = []
validation_set = []
# 遍历所有的标签，每个标签选取前5个作为support set，后面的作为验证数据
for label in all_labels:
    label_indexes = np.argwhere(all_targets == label)
    support_set.append((label_indexes[:5].flatten().tolist()))
    validation_set += label_indexes[5:].flatten().tolist()
print("support set:", support_set[:5])
print("validation set:", validation_set[:5])
print("validation size:", len(validation_set))
support set: [[0, 1, 2, 3, 4], [20, 21, 22, 23, 24], [40, 41, 42, 43, 44], [60, 61, 62, 63, 64], [80, 81, 82, 83, 84]]
validation set: [5, 6, 7, 8, 9]
validation size: 150
我们接下来需要定义一个预测函数，其给定一个图片，输出该图片的target。该函数的思路为：让该图片与support set里的所有类别都比较一下，看看与谁的相似度最高，那么该图片就是什么类别。由于一个类别有5张图片，我们可以通过取平均的方式来得到该图片为该类别的可能性。 
def predict(image):
    sim_list = [] # 存储image与每个类别的相似度
    # 一个类别一个类别的遍历，indexes存储的就是当前类别的5张图片的index
    for indexes in support_set:
        # 去validation_dataset中找出index对应的图片tensor
        tensor_list = []
        for i in indexes:
            tensor_list.append(validation_dataset[i][0])
        support_tensor = torch.stack(tensor_list)
        # 拿到该类别的5个图片后，就可以送给模型求image与它们的相似程度了，最后求个平均
        sim = model(image.repeat(5, 1, 1, 1).to(device), support_tensor.to(device)).mean()
        sim_list.append(sim)
    # 找出其中相似程度最高的那个，它就是预测结果
    result_index = torch.stack(sim_list).argmax().item()
    return all_labels[result_index]
我们来试下predict函数： 
predict(validation_dataset.__getitem__(validation_set[0])[0])
最后我们一个个的对验证集的数据进行验证，计算正确率。 
total = 0
total_correct = 0
# 由于验证集太大，为了更快的看到效果，我们验证前，将validation_set打乱一下再验证
random.shuffle(validation_set)
progress = tqdm(validation_set)
for i in progress:
    image, label = validation_dataset.__getitem__(i)
    predict_label = predict(image)
    total += 1
    if predict_label == label:
        total_correct += 1
    progress.set_postfix({
            "accuracy": str("%.3f" % (total_correct / total))
100%|██████████| 150/150 [00:06<00:00, 21.66it/s, accuracy=0.700]
print("Accuracy:", total_correct / total)
Accuracy: 0.7
最终，在这150个验证数据中，我们取得了70%的正确率，不算太高，但至少能说明模型是有效果的。 
 由于模型结构是我拍脑袋随便想的，而且比较小，所以如果用全部的658个类别做预测的话，效果会比较差，正确率大概只有15%左右，感兴趣的朋友可以尝试一下，并且优化模型。 
                    本文会使用Omniglot数据集训练一个孪生网络（相似网络），其可以用来判断两个图片的相似程度，通过该方式来实现小样本学习。本文使用Omniglot的训练集来训练神经网络，使用其验证集来构造Support Set。本文会从验证集的每个类别中拿出5个样本作为Support Set，一共挑选10个类别，即为10-way 5-shot的小样本学习。
				原文：https://blog.csdn.net/mao_feng/article/details/78939864
原博地址：https://blog.csdn.net/xhw205/article/details/79491649
小样本学习
来源：我们人类是具有快速从少量（单）样本中快速学习能力的，其实在我们学习的过程中，人类的大脑将对象和类别组成有用的信息将之分类。
首先需要声明的是，小样...
论文下载(提取码:nrh8)
随着深度学习和自然语言处理技术的发展，很多公司都在致力于发展人机对话系统，希望人和机器之间能够通过自然语言进行交互。笔者所在的阿里巴巴小蜜北京团队打造了一个智能对话开发平台——Dialog Studio，以赋能第三方开发者来开发各自业务场景中的任务型对话，而其中一个重要功能就是对意图进行分类。
大量平台用户在创建一个新对话任务时，并没有大量标注数据，每个意图...
os.environ['CUDA_VISIBLE_DEVICES']='0'
import torch
from my_MiniImagenet import MiniImagenet
import numpy as np
from my_meta import Meta
import argparse
from    torch.utils.data import DataLoader
def main():
				最近也在学习Few-shot learning，用Few-shot learning方法作图像分类，下面对Few-shot learning经典算法及其PyTorch实现作一下梳理：
MAML：Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks
PyTorch code:
1.https://github.com/dragen1860/MAML-Pytorch
2.https://github.com/katerak..
				本资源涉及小样本学习的通俗理解和实例展示。并陈列了有关小样本学习的五类主流模型。
特别注明：（1）本资源是通过调研部分论文和博客后进行的综合性展示资源，仅做入门了解使用（2）本资源仅有PPT文件，如需PPT对应的释义文本，还请私信联系，无偿赠送。
【本人因事出差，近期暂时无法发送释义文本，有需求的请留言，后期会私信发送】
				一.介绍：小样本学习，属于元学习的一种。目的是让机器具有自我判别的先验知识。
       比如说，我们想要训练对3类图片分别是 猪，牛，羊的模型，传统的监督学习是拿这3类的大量数据进行训练，然后得到一个模型。
       而小样本学习是想要通过其他大量的图片样本（不包括猪，牛，羊）训练出一个模型（比如相似度函数），这个模型具有先验知识（判别两类相同或者不相同的能力），所以使用这个模型，可以用来分类猪，牛，羊这三类，因为此时我们的模型已经具有分类两种类别异同的先验知识了...
				### 回答1：
few-shot learning代码是指用于实现few-shot学习的程序代码。few-shot学习是一种机器学习技术，旨在通过少量的样本数据来训练模型，以实现对新数据的分类或回归预测。在实际应用中，由于数据量有限，few-shot学习具有广泛的应用前景。目前，有许多开源的few-shot学习代码库可供使用，如PyTorch、TensorFlow等。这些代码库提供了各种few-shot学习算法的实现，包括基于元学习的方法、基于生成模型的方法等。   
### 回答2：
Few-shot learning 是一种利用少量样本数据来完成分类任务的学习方式，它能够在训练集中只有非常少量的样本数据的情况下，对新样本进行准确分类。在实际应用中，我们很难获得大量标注数据用来训练分类器，因此 Few-shot learning 是一个非常重要的研究方向。
在代码实现方面，Few-shot learning 需要考虑一些关键问题。首先是如何从少量样本中学习出有效的特征表示。为了解决这个问题，我们可以借助已有的预训练模型提取特征，例如 VGG、ResNet、DenseNet 等，也可以使用一些特定的模型，例如 Siamese 或 Prototypical Networks。
其次是如何定义相似度度量方法。因为 Few-shot learning 中的样本数量非常少，我们需要考虑如何利用已知的样本来计算未知样本与已知样本之间的相似度。常用的相似度度量方法包括欧式距离、余弦相似度、马氏距离、汉明距离等。
最后是如何进行分类。在 Few-shot learning 中，我们需要使用少量的样本来对新的未知样本进行分类。这个过程需要考虑如何选择合适的分类器，例如 k-近邻分类器和支持向量机分类器等。同时，我们也需要考虑如何设计模型结构和计算过程，以提高分类器的准确率和鲁棒性。
总结来说，Few-shot learning 是一个非常重要的研究领域，它能够利用少量样本进行分类任务，为实际应用带来了很大的便利。在实际应用中，我们需要考虑如何利用已有的模型和算法来处理数据，以提高分类器的性能。   
### 回答3：
Few-shot learning是指在面对少量有标注数据的情况下，通过利用已有的知识，来训练出能够准确推断新样本标签的模型。现在先介绍一下few-shot learning中最经典的模型之一，即Prototypical Network。
其中，Prototypical Network主要涉及到的概念包括：“prototype”、“episode”和“embedding”。
“prototype”是指每个类别的中心点，可以用来度量每个样本点和不同类别的相似度。在模型的训练过程中就是通过计算每一个类别内所有样本的平均值来得到prototype。
“episode”是指few-shot learning任务中的一次训练过程，每次从大量数据中采出少量不同于已有类别的样本，与已有类别的样本混合，形成episode。在实际的few-shot learning中，episode通常包含类别数、每类样本数以及查询数等统计信息。
“embedding”指样本的特征表示，可以看做经过特征提取后得到的一个向量表示。在使用Prototypical Network时，需要把样本的原始图像数据转换成每个样本的embedding，用来计算每个样本到不同prototype的距离。
下面是经典的Prototypical Network在Pytorch中的代码实现：
首先，导入包和定义模型所需的各种函数。
```Python
import torch
import torch.nn as nn
def euclidean_dist(x, y):
    计算两个向量之间的欧几里得距离
    return torch.pow(x, 2).sum(1, keepdim=True) + torch.pow(y, 2).sum(1, keepdim=True).t() - 2 * torch.matmul(x, y.t())
def euclidean_metric(x, y):
    计算两个向量之间的距离，用于计算相似度
    return -torch.sqrt(torch.sum(torch.pow(x - y, 2)))
然后，定义Prototypical Network模型。
```Python
class ProtoNet(nn.Module):
    def __init__(self, x_dim=3, h_dim=64, z_dim=64):
        super(ProtoNet, self).__init__()
        self.encoder = nn.Sequential(
            nn.Conv2d(x_dim, h_dim, kernel_size=3, stride=1),
            nn.BatchNorm2d(h_dim),
            nn.ReLU(),
            nn.Conv2d(h_dim, h_dim, kernel_size=3, stride=1),
            nn.BatchNorm2d(h_dim),
            nn.ReLU(),
            nn.Conv2d(h_dim, h_dim, kernel_size=3, stride=1),
            nn.BatchNorm2d(h_dim),
            nn.ReLU(),
            nn.Conv2d(h_dim, z_dim, kernel_size=4, stride=1),
            nn.BatchNorm2d(z_dim),
            nn.ReLU()
    def forward(self, x):
        x = self.encoder(x)
        x = torch.mean(x.view(x.size(0), x.size(1), -1), dim=2)
        return x
接着，定义训练过程。
```Python
def train_step(model, optimizer, train_loader, device):
    在一个episode里面对模型进行训练
    model.train()
    total_loss = 0
    total_acc = 0
    for batch_idx, (data, target) in enumerate(train_loader):
        n_classes = len(torch.unique(target))
        data, target = data.to(device), target.to(device)
        optimizer.zero_grad()
        z = model(data)
        z_dim = z.shape[-1]
        z_proto = torch.empty(n_classes, z_dim, device=device)
        for i in range(n_classes):
            z_proto[i] = torch.mean(z[target == i], dim=0)
        dists = euclidean_dist(z, z_proto)
        log_p_y = nn.functional.log_softmax(-dists, dim=1).view(n_classes, -1, dists.size(-1))
        target_one_hot = torch.zeros(n_classes, log_p_y.size(1), device=device).scatter_(0, target.view(n_classes, -1), 1)
        loss = -(log_p_y * target_one_hot).sum()
        acc = torch.mean((torch.argmax(log_p_y, dim=2) == target).float())
        total_loss += loss.item()
        total_acc += acc.item()
        loss.backward()
        optimizer.step()
    return total_loss, total_acc / (batch_idx + 1)
最后，定义测试过程。
```Python
def test(model, test_loader, device):
    在测试数据集上测试模型性能
    model.eval()
    total_acc = 0
    with torch.no_grad():
        for batch_idx, (data, target) in enumerate(test_loader):
            n_classes = len(torch.unique(target))
            data, target = data.to(device), target.to(device)
            z = model(data)
            z_dim = z.shape[-1]
            z_proto = torch.empty(n_classes, z_dim, device=device)
            for i in range(n_classes):
                z_proto[i] = torch.mean(z[target == i], dim=0)
            dists = euclidean_dist(z, z_proto)
            log_p_y = nn.functional.log_softmax(-dists, dim=1).view(n_classes, -1, dists.size(-1))
            acc = torch.mean((torch.argmax(log_p_y, dim=2) == target).float())
            total_acc += acc.item()
    return total_acc / (batch_idx + 1)
在以上代码的基础上，只要提供相应的训练集和测试集，即可用来训练和测试few-shot learning模型了。
                【论文阅读】FC-Net: A Method of Few-Shot Network Intrusion Detection Based on Meta-Learning Framework
                    weixin_43046103: 
                    您好方便把源代码发我一份吗，邮箱是33699625@qq.com，万分感谢！
                万字逐行解析与实现Transformer，并进行德译英实战（三）
                    口吅 品㗊: 
                    为什么会出现这种错误
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 37: invalid start byte