sift算法python-sift算法

朋友们，你们知道sift算法这个问题吗？如果不了解该问题的话，小编将详细为你解答，希望对你有所帮助！

在sift算法中为什么要进行Gaussian差分?原理是什么?谢谢。。

这主要是因为SIFT算法只考虑了尺度和旋转不变形，没有考虑仿射不变性。通过高斯平滑，可以使关键点附近的梯度幅值有较大权重，从而部分弥补没考虑仿射不变形产生的特征点不稳定。

SIFT具有尺度不变性和旋转不变性。具体分为：尺度规范化的Laplacian of Gaussian(LoG)算子具有尺度不变性。在具体实现中，可用Difference of Gaussian(DoG)算子近似LoG算子，在构建的尺度空间中检测稳定的特征点。

Sift算法是David Lowe于1999年提出的局部特征描述子，并于2004年进行了更深入的发展和完善。Sift特征匹配算法可以处理两幅图像之间发生平移、旋转、仿射变换情况下的匹配问题，具有很强的匹配能力。

对水平方向上的相邻点进行差分处于是可以检测垂直方向上的亮度变化，通常被称为水平边缘检测算子(horizontal edge detector).因为其差分值为零，所以水平算子寻不会显示水平方向的亮度变化。

原理 opencv官网解释 SURF是SIFT的加速版，它善于处理具有模糊和旋转的图像，但是不善于处理视角变化和光照变化。

SIFTSIFT 描述子可以算是 CV 界最具影响力的技术之一。从关键点检测层面，主要使用高斯差分 (Difference of Gaussian， DoG) 方法检测多尺度空间上的极值点，作为关键点。

1、SIFT特征的信息量大，适合在海量数据库中快速准确匹配。

2、SIFT特征不只具有尺度不变性，即使改变图像的旋转角度，亮度或拍摄视角，仍然能够得到好的检测效果。这是一个初始化操作，尺度空间理论目的是模拟图像数据的多尺度特征。

3、尺度不变特征变换 (SIFT) 是最流行和最强大的特征提取算法之一，因为它对尺度、旋转和光照保持不变。它已被广泛应用于视频跟踪、图像拼接、同时定位和映射(SLAM)、运动结构(SFM)等领域。

要从image中找到与模板最匹配的部分，Template图像是事先从image图像中截取的一部分。所用的为python模块skimage中的match_template方法，match_template方法使用的是快速归一化互相关算法【2】。

数字分割：将数字从图像中分离出来，可以使用轮廓检测等方法实现。模板匹配：将每个数字与数字模板进行匹配，选择匹配度最高的数字作为识别结果。整合结果：将每个数字的识别结果整合起来，包括小数点。

在行为识别中，基于模板匹配的算法可以分为帧对帧匹法和融合匹法。主要方法有：运动能量图像（MEI）和运动历史图像（MHI），基于轮廓的平均运动形状（MMS）和基于运动前景的平均运动能量（AME）等。

Opencv模板匹配函数里面包含了匹配的置信度：img_rgb = cvimread(mario.jpg)。img_gray = cvcvtColor(img_rgb，cvCOLOR_BGR2GRAY)。template = cvimread(mario_coin.jpg， 0)。

一般来说，语音识别的方法有三种：基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。

目前，用于行为识别的状态空间方法和模板匹配方法通常在计算代价和运动识别的准确度之间进行折中，故仍需要寻找和8开发新的技术以利于提高行为识别性能的同时，又能有效地降低计算的复杂度。

实际计算过程中，为了增强匹配的稳健性，Lowe建议对每个关键点使用4×4共16个种子点来描述，这样对于一个关键点就可以产生128个数据，即最终形成128维的SIFT特征向量。

使用的是向量夹角来近似欧氏距离：先将128维SIFT特征向量归一化为单位向量（每个数除以平方和的平方根），然后点乘来得到向量夹角的余弦值，最后利用反余弦（acos函数）求取向量夹角。

但在实际的应用中，如SIFT特征矢量128维，SURF特征矢量64维，维度都比较大，直接利用k-d树快速检索（维数不超过20）的性能急剧下降，几乎接近贪婪线性扫描。

对象后，通过该对象，对之前SIFT产生的特征点进行遍历，找到该特征点所对应的128维特征向量。具体方法参见opencv中SiftDescriptorExtractor所做的SIFT特征向量提取工作简单分析。

以上内容就是解答有关sift算法的详细内容了，我相信这篇文章可以为您解决一些疑惑，有任何问题欢迎留言反馈，谢谢阅读。