计算机视觉
# 卷积核
# 高斯卷积
高斯核总值的和为1,分布满足正态分布
能消除高斯噪声
# 中值滤波器
能处理噪声
# 边缘检测
canny边缘检测
- 用高斯函数对图像做滤波处理
- 计算梯度幅值和方向
- 对每个点做非最大抑制:得到边缘清晰的图像
- 从强边开始跟进弱边:解决边缘出现断断续续的情况
# 特征点提取
# 角点检测
可以找到局部最大点
# 尺度选择特性SIFT
# DOG高斯差分
- 通过平滑将图像分成多组,每个图片尺寸一样,平滑程度不同
- 生成DOG金字塔:对相邻的高斯尺度空间图像相减,得到DOG的响应值图片
- 空间极值点检测:相邻图片3*3的区域内27个像素点的最大值保留
- 非最大抑制:去除阔值
- 稳定关键点的方向信息匹配:统计监测点16*16窗口的方向出现次数,得到主方向和辅方向
- 关键点描述:精简只剩8个辅助方向,作为每个关键点描述符
# 特征点匹配
- 暴力匹配:最小距离法
- 暴力匹配:距离阔值法
- 交叉匹配:一次匹配后,反过来用匹配到的点去匹配,如果仍然能匹配到,则保留
# 场景的类别识别-词袋向量
- 提取特征:SIFT方法提取图片的所有特征点
- 学习可视化词汇:用聚类进行分类
- 构建视觉词典:
- 用视觉词汇的频率来表示图像:
# 受监督的机器学习
# KNN:
是一种分类算法,懒惰学习,
数据事先分好了类,对于新加入的一个数据,找到离他最近的k个值,这个数据属于k个值里所属分类比例最大的那个类
# 支持向量机
一条线能将图像分成两部分
# 无监督的机器学习
# k-means聚类算法
# PCA算法
选取样本方差矩阵的前k个特征值对应的特征向量作为简化后的内容
# 神经网络
- 数据输入层:对原始图像数据进行预处理
- 卷积层:得到目标的特征
- 激活层:将数值压缩到0-1之间,决定了某个神经元是激活还是抛弃
- 池化层:压缩图像,去掉冗余信息
- 全连接层:将特征空间映射到样本区间,将之前提取到的特征组合起来,
上次更新: 2025/02/21, 14:57:10