opencv进阶1

如题所述

举报该问题

其他回答

第1个回答 2022-06-22

在Opencv中人脸识别是基于Haar特征+Adaboost级联分类器来实现人脸识别的!

要理解这节内容,我们首先要明白什么是特征?

特征其实就是某个区域的像素点经过运算之后得到的结果! 例如haar特征其实就是用下图列出的模板在图像中滑动,计算白色区域覆盖的像素之和减去黑色区域覆盖的像素之和,运算出来的结果就是haar特征值!

Haar特征一般和Adaboost分类器结合在一起进行目标识别!

这里需要运动机器学习的知识! 不过值得庆幸的是Opencv已经为我们训练好了数据,并且已经提取出了人脸的特征,在opencv的源码中有相应的xml特征文件. 并且我们只需要调用opencv提供好的API即可快速完成人脸识别的功能!

核心api为:

实现步骤:

HSV(Hue, Saturation, Value)是根据颜色的直观特性由A. R. Smith在1978年创建的一种颜色空间, 也称六角锥体模型(Hexcone Model)。

这个模型中颜色的参数分别是：色调（H），饱和度（S），明度（V）

用角度度量，取值范围为0°～360°，从红色开始按逆时针方向计算，红色为0°，绿色为120°,蓝色为240°。它们的补色是：黄色为60°，青色为180°,品红为300°；

饱和度S表示颜色接近光谱色的程度。一种颜色，可以看成是某种光谱色与白色混合的结果。其中光谱色所占的比例愈大，颜色接近光谱色的程度就愈高，颜色的饱和度也就愈高。饱和度高，颜色则深而艳。光谱色的白光成分为0，饱和度达到最高。通常取值范围为0%～100%，值越大，颜色越饱和。

明度表示颜色明亮的程度，对于光源色，明度值与发光体的光亮度有关；对于物体色，此值和物体的透射比或反射比有关。通常取值范围为0%（黑）到100%（白）。

结论:

注意: 在opencv中,H、S、V值范围分别是[0,180]，[0,255]，[0,255]，而非[0,360]，[0,1]，[0,1]；

这里我们列出部分hsv空间的颜色值, 表中将部分紫色归为红色

[图片上传失败...(image-4f70f7-1563843266225)]
.jpg)

注意,这仅仅只能做一个比较粗糙的判定,按照我们人的正常思维,在傍晚临界点我们也无法判定当前是属于晚上还是白天!

在一张图片中,如果某个物体的颜色为纯色,那么我们就可以使用颜色过滤inRange的方式很方便的来提取这个物体.

下面我们有一张网球的图片,并且网球的颜色为一定范围内的绿色,在这张图片中我们找不到其它颜色也为绿色的图片,所以我们可以考虑使用绿色来提取它!

图片的颜色空间默认为BGR颜色空间,如果我们想找到提取纯绿色的话,我们可能需要写(0,255,0)这样的内容,假设我们想表示一定范围的绿色就会很麻烦!

所以我们考虑将它转成HSV颜色空间,绿色的色调H的范围我们很容易知道,剩下的就是框定颜色的饱和度H和亮度V就可以啦!

实现步骤:

图像二值化（ Image Binarization）就是将图像上的像素点的灰度值设置为0 或 255，也就是将整个图像呈现出明显的黑白效果的过程。

在数字图像处理中，二值图像占有非常重要的地位，图像的二值化使图像中数据量大为减少，从而能凸显出目标的轮廓。

[图片上传失败...(image-a31052-1563843266226)]

我们使用一个全局值作为阈值。但是在所有情况下这可能都不太好，例如，如果图像在不同区域具有不同的照明条件。在这种情况下，自适应阈值阈值可以帮助。这里，算法基于其周围的小区域确定像素的阈值。因此，我们为同一图像的不同区域获得不同的阈值，这为具有不同照明的图像提供了更好的结果。

除上述参数外，方法cv.adaptiveThreshold还有三个输入参数：

该 adaptiveMethod 决定阈值是如何计算的：

该 BLOCKSIZE 确定附近区域的大小和 Ç 是从平均值或附近的像素的加权和中减去一个常数。

采用日本人大津提出的算法,又称作最大类间方差法,被认为是图像分割中阈值选取的最佳算法,采用这种算法的好处是执行效率高!

如果我们把图像看作信号，那么噪声就是干扰信号。我们在采集图像时可能因为各种各样的干扰而引入图像噪声。在计算机中,图像就是一个矩阵, 给原始图像增加噪声, 我们只需要让像素点加上一定灰度即可.
f(x, y) = I(x, y) + noise

常见的噪声有椒盐噪声（salt and pepper noise），为什么叫椒盐噪声？因为图像的像素点由于噪声影响随机变成了黑点（dark spot）或白点（white spot）。这里的“椒”不是我们常见的红辣椒或青辣椒，而是外国的“胡椒”（香料的一种）。我们知道，胡椒是黑色的，盐是白色的，所以才取了这么个形象的名字.

接下来我们来生成10%的椒噪声和盐噪声:

我们还要注意，opencv的图像矩阵类型是uint8，低于0和高于255的值并不截断，而是使用了模操作。即200+60=260 % 256 = 4。所以我们需要先将原始图像矩阵和噪声图像矩阵都转成浮点数类型进行相加操作，然后再转回来。

相似回答

计算机视觉 OpenCV (1)—读取、显示和写入图像答：OpenCV，全称为Open Source Computer Vision Library，是一个跨平台的计算机视觉库，由英特尔公司发起并参与开发，免费适用于商业和研究领域。OpenCV功能强大，广泛应用于实时图像处理、计算机视觉与模式识别。计算机表示图像的方式通常采用矩阵结构，每个像素包含R、G、B通道信息，以及可选的A通道表示深度或透明度...

求opencv2.3.1 for windows 安装文件,几乎所有人都说在www.opencv.org...答：你进这个地址试一下 http://wiki.opencv.org.cn/index.php/%E9%A6%96%E9%A1%B5

【Python学习蝴蝶书】第三章初探OpenCV1-基本数据类型答：在Python中，opencv处理的图像数据类型是numpy库中的ndarray类型，二维点或点集一般是tuple、list或者numpy的array类型。在C和C++中，opencv的基本数据类型包括：1. CvPoint：是一个包含两个整型（integer）x和y的简单结构体，表示一个点的位置坐标，如图像的像素坐标（单位：像素）。2. CvPoint2D32f：为...

同一台电脑可以安装两个版本visual studio吗?答：同一台电脑一般情况下来说，最好安装其中一个版本，这样在使用的过程中，会更加的顺畅，辨识度更高，有利于工作的顺利开展。人们通过输入设备，把需要处理的信息输入电脑，电脑通过中央处理器，把信息加工后，再通过输出设备，把处理后的结果告诉人们。其实这个模型很简单，举个简单的例子，你要处理的信息...

OpenCV中这句话if( argc == 3 && (pImg = cvLoadImage( argv...答：argc（argument count）也就是输入参数的个数。比如你调用的时候在命令行下输入是 test.exe a.jpg b c，那么参数就是4个。这属于主函数传参问题 cvLoadImage( argv[1], 0)) != 0 就是说图片加载是否成功。也就是说上面的 a.jpg 加载是否成功。失败的原因主要是图片不存在，存在还是加载...

关于opencv1和opencv2使用的问题答：首先回答你第一个问号，iplImage和mat当然是可以转换的，而且转换也比较简单；第二个问号，2是基于c++的，是有类封装这个概念的，而1是基于C的，所有是没有类的，而且它的结构体似乎也没有现在的结构体发达，所以1是不会提示出相应的类的；第三个问号，为什么1可以读取而2不可以呢？不然这个2的...

opencv中int step = (int)img.step1()怎么理解?答：规整化的step，值为step / elemSize1。定义如下：inline size_t Mat::step1(int i) const { return step.p[i]/elemSize1(); } 仍以上例代码中定义的img为例，来看下step,step1具体的值：img（3*4）的type是CV_16UC4,step[0]是其一行所占的数据字节数4 *4 * 16 / 8 = 32.step...

大家正在搜

halcon和opencv哪个好 opencv resize vs opencv opencv api opencv3 opencv4 opencv怎么使用 opencv图像匹配 opencv中文手册