松垮垮 松垮垮
首页
  • GPU并行编程
  • 图形学
  • 归并算法
  • 计算机视觉
  • css
  • html
  • JavaScript
  • vue
  • 压缩命令
  • cmdline
  • Docker
  • ftrace跟踪技术
  • gcov代码覆盖率测试
  • GDB
  • git
  • kgdb
  • linux操作
  • markdown
  • systemtap
  • valgrind
  • 设计模式
  • 分布式
  • 操作系统
  • 数据库
  • 服务器
  • 网络
  • C++
  • c语言
  • go
  • JSON
  • Makefile
  • matlab
  • OpenGL
  • python
  • shell
  • 正则表达式
  • 汇编
  • GPU并行编程
  • mysql
  • nginx
  • redis
  • 网络
  • 计算机视觉
  • 进程管理
  • linux调试
  • 【Python】:re.error bad escape i at position 4
  • 搭建ai知识助手
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

松垮垮

c++后端开发工程师
首页
  • GPU并行编程
  • 图形学
  • 归并算法
  • 计算机视觉
  • css
  • html
  • JavaScript
  • vue
  • 压缩命令
  • cmdline
  • Docker
  • ftrace跟踪技术
  • gcov代码覆盖率测试
  • GDB
  • git
  • kgdb
  • linux操作
  • markdown
  • systemtap
  • valgrind
  • 设计模式
  • 分布式
  • 操作系统
  • 数据库
  • 服务器
  • 网络
  • C++
  • c语言
  • go
  • JSON
  • Makefile
  • matlab
  • OpenGL
  • python
  • shell
  • 正则表达式
  • 汇编
  • GPU并行编程
  • mysql
  • nginx
  • redis
  • 网络
  • 计算机视觉
  • 进程管理
  • linux调试
  • 【Python】:re.error bad escape i at position 4
  • 搭建ai知识助手
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • GPU并行编程

  • 图形学

  • 图形学(细分曲面)Subdivision
  • 归并算法
  • 计算机视觉

    • skimage
    • 人脸
    • 受监督的机器学习
    • 图像频谱
    • 场景的实例识别
    • 场景的类别识别-词袋向量(Recognition
    • 基础
    • 无监督机器学习
      • K-means聚类算法
        • 目标:
        • 基本步骤
        • 如何选择聚类的个数
        • 优缺
      • PCA算法
    • 滤波器(卷积核)
    • 特征点提取
    • 目标的种类检测
    • 神经网络
    • 边缘检测
  • cs
  • 计算机视觉
songkuakua
2025-02-15
目录

无监督机器学习

# 无监督机器学习

Owner: -QVQ-

有监督学习和无监督学习的区别就在于学习的数据是不是带标签,也就是我们是否知道学习的数据是什么。

利用无标签的数据学习数据的分布或者数据之间的关系 Untitled

# 聚类(clustering):

就是将一堆零散的数据根据某些标准分为几个类别,一般来说最常使用的标准是距离,

距离也分为好几类,比如欧式距离(空间中两点的直线距离)、曼哈顿距离(城市街区距离)、马氏距离(数据的协方差距离)和夹角余弦。 Untitled

# K-means聚类算法

# 目标:

划分图像为几个有意义的相似的区域 Untitled

或者将部分作为一个结果 Untitled

将相似的点归类到一起,并用一个记号表示他们

# 基本步骤

1 随意选择k个中心

2 将每个点划分给最近的一个中心

3 为每一聚计算新的中心

当标准为密度或颜色时: Untitled

# 如何选择聚类的个数

验证设置-

尝试不同数量的集群并观察性能

在构建字典(稍后讨论)时,集群越多通常效果越好。

# 优缺

优点:

属于无监督学习,无须准备训练集 原理简单,实现起来较为容易 结果可解释性较好

缺点:

需手动设置k值。 在算法开始预测之前,我们需要手动设置k值,即估计数据大概的类别个数,不合理的k值会使结果缺乏解释性 可能收敛到局部最小值, 在大规模数据集上收敛较慢 对于异常点、离群点敏感

可能会很慢

# 降维(dimensionality reduction):

指的是在保证数据所具有的代表性特性或者分布的情况下,将高维数据转化为低维数据的过程,这个过程包括数据的可视化和数据的精简。

简单来说,去除一些对于结果没有意义或者意义极小的数据,从而方便计算分析 Untitled

# PCA算法

PCA主要就是选择样本协方差矩阵的前k个特征值对应的特征向量作为简化后的内容

上次更新: 2025/02/21, 14:57:10
基础
滤波器(卷积核)

← 基础 滤波器(卷积核)→

最近更新
01
搭建ai知识助手
02-23
02
边缘检测
02-15
03
css
02-15
更多文章>
Theme by Vdoing | Copyright © 2025-2025 松垮垮 | MIT License | 蜀ICP备2025120453号 | 川公网安备51011202000997号
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 纯净模式