GPU并行编程
算法难度标准:数据依赖、数据并行
性能优化:
- 减少控制分支
- 并行规约:将数据划分成更小的块分别计算,再汇总到一起
- 矩阵转置:为了更好的作规约
k-means的优化点
- 数据转为一维矩阵再拷贝到GPU
- 转置
- 计算每个元素到点中心的距离,无依赖关系因此采用并行计算
- 使用共享内存
- 使用线程数量的变量存储当前迭代轮聚类中心变化的次数,计算完成后累加求和得到总值,小于一个阔值则停止迭代
上次更新: 2025/02/21, 14:57:10
算法难度标准:数据依赖、数据并行
性能优化:
k-means的优化点