logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

微小目标检测:《RFLA: Gaussian Receptive Field based Label Assignment for Tiny Object Detection》

微小的物体以其极其有限的像素数量为特点,在计算机视觉社区中始终是一个难以破解的难题。微小目标检测 (TOD) 是最具挑战性的任务之一,由于微小目标缺乏区分特征,通用目标检测器通常无法在 TOD 任务中提供令人满意的结果。

文章图片
#目标检测#目标跟踪#计算机视觉
使用LabelMe标注目标检测数据集并转换为VOC2017格式

参考:labelme 格式转 VOC2007 数据集格式1、labelme数据格式labelmeset:即图像文件和json文件放在同一文件夹下1.jpg1.json2.jpg2.json…2、转换代码# -*- coding: utf-8 -*-"""Created on Thu Sep 19 14:51:00 2019@author: Andrea"""import osimport nump

文章图片
#目标检测
高分辨大尺寸图像的目标检测切图处理

但是在诸如航拍图像等任务上,图像尺寸通常几千x几千甚至上万,目标也是非常小的,如果resize到640的尺寸,显然目标都已经丢失完了。实际上可以通过切图的方式进行推理,也就是将高分辨率的图切成640x640的图像块,每一个块再去做目标检测,最后再将图像块中目标的坐标转换为大尺寸图上即可。如图所示,某个小图中坐标为(50,90),通过计算得知所处第5列,则左侧有4个小图,考虑到有重叠区域,则左侧有4

文章图片
#目标检测#目标跟踪#人工智能
ubuntu20.04+安装单opencv和多个opencv+vscode

有问题或者不清楚见作者原文,那写的更清楚。

文章图片
#opencv#vscode#人工智能
伪装目标检测(Camouflaged Object Detection, COD)教程

伪装目标检测(Camouflaged Object Detection, COD)是一项计算机视觉任务,旨在识别和分割背景中难以察觉的目标,如动物伪装、隐形物体检测等。由于伪装目标通常与背景高度相似,这项任务比传统的目标检测更具挑战性。伪装目标检测是一个极具挑战性的计算机视觉任务,广泛应用于生态保护、军事隐身目标检测、医学影像等领域。深度学习技术的进步使得 COD 取得了显著提升,但仍然存在泛化能

文章图片
#目标检测#人工智能#计算机视觉
MicroNet: Improving Image Recognition with Extremely Low FLOPs--Yunsheng Li

本文重点解决在极低FLOPs条件下设计准确率更高的网络,通过Micro-Factorized Convolution在保证节点连接性条件下减低计算量,通过Dynamic Shift-Max激活函数加强通道间的联系,改善非线性,以弥补网络不能太深所带来的缺陷。通过实验看出MicroNet比MobileNetV3等轻量化网络不经拥有更低的FLOPs,而且在精度上的提升非常巨大。

文章图片
#深度学习#cnn#人工智能
训练时,Loss或者精度不变的bug

目前遇到了造成该现象的两种原因:1、交叉熵和Softmax的错误使用该问题我已经总结在另一篇文章了:paddle:使用CrossEntropyLoss作为loss,训练时loss不下降?,注意paddle和pytorch的api很像,所以见一知二,自己推广。原因在于CrossEntropyLoss函数实际上内置了LogSoftmax 和 NLLLoss,也就是你一旦使用CrossEntropyLo

文章图片
#pytorch#深度学习#人工智能
图像形变的两种方法:前向映射与反向映射

前向映射这种方式有一个缺点,在图像旋转中,原图的坐标和新图的坐标不是一一对应的。在这个过程中,原图中多个像素点(左图红点)经过计算和取整后,可能映射到新图的同一个坐标点(右图红点),造成一些像素点永远没有对应的映射点(右图黑点),这些黑点最终呈现的就是背景色。顾名思义,反向映射就是根据新图坐标,计算其在原图中的坐标点,然后将原图中像素点值复制到新图中即可。我们知道原图中一个像素点的位置,可以通过计

文章图片
#pytorch#计算机视觉#opencv
卷积核(kernel)和过滤器(filter)的区别

0. 前言关于卷积核和过滤器的定义,事实上在使用时没有多在意,毕竟能理解作者意思即可。但是这篇文章让我理解了为什么使用深度学习框架定义卷积层时,该层的输出通道=卷积核的个数?因为在我看来,如果输入通道=3(比如RGB格式图片),卷积核个数为1,那么输出通道=3,因为卷积核对每个输入通道都进行运算。但实际上深度学习框架中定义卷积核个数,可能是指滤波器的个数。1. 两者分别一句话:卷积核是二维的,滤波

#神经网络
    共 73 条
  • 1
  • 2
  • 3
  • 8
  • 请选择