tensor[...,0]的作用_prediction[..., 0]_真的只会一点点的博客

相关文章推荐
踢足球的芒果 · WPF 窗口居中 & ...· 2 年前 ·
另类的滑板 · Android进阶CameraX与Camer ...· 2 年前 ·
玩篮球的沙滩裤 · python ...· 2 年前 ·
会开车的仙人掌 · 有哪些好用的开源的表单系统？ - 知乎· 2 年前 ·
痛苦的帽子 · javascript——使用new ...· 2 年前 ·
在yolo源码中，有这样几行代码：
        x = torch.sigmoid(prediction[..., 0])  # Center x
        y = torch.sigmoid(prediction[..., 1])  # Center y
        w = prediction[..., 2]  # Width
        h = prediction[..., 3]  # Height
        pred_conf = torch.sigmoid(prediction[..., 4])  # Conf
        pred_cls = torch.sigmoid(prediction[..., 5:])  # Cls pred.
prediction.shape为[4,3,13,13,25] 
x.shape为[4,3,13,13];
 y.shape为[4,3,13,13];
 w.shape为[4,3,13,13];
 h.shape为[4,3,13,13];
 pred_conf.shape为[4,3,13,13];
 pred_cls.shape为[4,3,13,13,20]; 
也就是说，prediction[…, 0]为prediction前面所有维度保持不变，只把最后一维度切分
                    在yolo源码中，有这样几行代码：        x = torch.sigmoid(prediction[..., 0])  # Center x        y = torch.sigmoid(prediction[..., 1])  # Center y        w = prediction[..., 2]  # Width        h = prediction[..., 3]  # Height        pred_conf = torch.sigmoid(predict
				Tensor(0) : 代表的是一个普通的数字0，维度是0.
Tensor( [0] ) : 代表是一个向量，维度是1。有几组中括号，维度就是几。只不过如果里面只有一个数字的话，这个时候恰巧它只有一个数字而已，不像矩阵一样的，有很多数字。
总结：一个Tensor的维度是多少，它的size或者shape的向量的长度就是多少。假如一个Tensor的维度是3，那肯定它的形状要把3个维度上的形状都告诉你。一般，一个数据点的数据是一个向量，是一维的。全连接网络的数据是二维的，是一个向量，是行数×特征数量。CNN的
a= tensor([[[[-0.3767, -0.8647, -0.6132, -0.5862],
          [ 0.5800,  0.3467, -0.4182, -0.0916],
          [ 0.6316, -0.6858, -0.2674,  0.1670]]],
        [[[-0.1980, -
self.bbox_attrs = 5 + num_classes # 5 =（4+1）：框的四个参数（x，y，w，h）+ 框内是否有物体
prediction = input.view(batch_size, len(self.anchors_mask[i]),
                                    self.bbox_attrs, input_height, input_width).permute(0, 1, 3, 4, 2).cont
				我们在之前的讲解中已经完成了Yolov3的整体网络框架，即已经构建了一个能为给定输入图像输出多个目标检测结果的模型。具体来说，我们的输出是一个形状为 B x 10647 x 85 的张量；其中 B 是指一批（batch）中图像的数量，10647 是每个图像中所预测的边界框的数量，85 是指边界框属性的数量。
在完成具体框架后，就要看看yolov3的训练机制了。我们首先整体讲解它的training ...
				def predict_transform(prediction, inp_dim, anchors, num_classes, CUDA=True):
    https://blog.paperspace.com/how-to-implement-a-yolo-v3-object-detector-from-scratch-in-pytorch-part-3/
    :param prediction: [2, 255, 13, 13]. 这个255=(1+4+80)*3
prediction = (
            x.view(num_samples, self.num_anchors, self.num_classes + 5, grid_size, grid_size)
            .perm...
逻辑回归虽然名字叫做回归，但实际上却是一种分类学习方法。
线性回归完成的是回归拟合任务，而对于分类任务，我们同样需要一条线，但不是去拟合每个数据点，而是把不同类别的样本区分开来。
2 Classification(分类)
分类是监督学习的一个核心问题，在监督学习中，当输出变量Y取有限个离散值时，预测问题便成为分类问题。这时，输入变量X可...
				翻译原文：https://blog.paperspace.com/how-to-implement-a-yolo-v3-object-detector-from-scratch-in-pytorch-part-3/
本篇文章是《如何使用PyTorch从零开始实现YOLO(v3)目标检测算法》的第四部分。这系列论文一共有五篇文章，五篇文章的主要内容在下文中有涉及。如果有问题欢迎和我交流~
				Prediction算法使用
Surprise 提供了许多built-in算法. 所有算法从AlgoBase基类继承, 当使用一些关键的函数时(比如predict, fit 和 test). 可以从prediction_algorithms包文档中获得所有可以使用的算法的详细信息
每一个算法都是Surprise的一个全局的命名空间, 所以我们需要从Surprise包中导入算法, 比如
一些算法可...
				`transforms.ToTensor()`是PyTorch中的一个预处理函数，用于将PIL图像或numpy.ndarray数组转换为张量。其作用是将图像数据转换为张量数据，以便能够输入到神经网络中进行训练或推理。具体来说，它会将像素值范围从[0, 255]缩放到[0, 1]之间，并将数据类型转换为torch.FloatTensor。
使用`transforms.ToTensor()`的示例代码如下：
from torchvision import transforms
transform = transforms.Compose([
    transforms.ToTensor(),
在这个例子中，我们创建了一个`transforms.Compose()`对象，将`ToTensor()`函数添加到了其中。这样，当我们加载数据集时，就可以使用这个预处理函数将图像数据转换为张量形式：
from torchvision import datasets
train_data = datasets.MNIST(root='data', train=True, transform=transform, download=True)
test_data = datasets.MNIST(root='data', train=False, transform=transform, download=True)
这里的`train=True`表示加载训练集，`transform=transform`表示对图像数据进行预处理。