当前位置: 首页 > news >正文

使用监督学习训练图像聚类模型

基于监督学习的图像聚类新范式

传统机器学习模型依赖标注数据进行监督学习,而获取标注数据成本高昂。无监督学习的主要方法是聚类,即根据显著特征将数据点分组。传统聚类算法依赖启发式规则(如聚类中心距离阈值或分布形态)确定边界。在ICCV 2021发表的论文中,我们提出从数据中学习边界划分的方法。

技术架构

  1. 图表示构建

    • 使用元训练数据训练监督分类器(编码器-解码器结构)
    • 仅保留编码器将图像转换为特征向量
    • 基于特征空间构建k近邻图,节点代表图像
  2. 层次化图神经网络(Hi-LANDER)

    • 基础模型LANDER(链接近似与密度估计优化):
      • 通过GNN生成节点嵌入
      • 联合预测节点链接(同类别连接)和局部数据密度
    • 层次化处理:
      • 首轮聚类后将簇聚合为超节点
      • 迭代执行近邻连接和GNN处理直至无新边产生

核心创新

  • 双目标联合训练:首次在单一模型中同时优化链接预测和密度预测任务
  • 全图处理机制:突破传统子图划分限制,实现全局信息流动
  • 元训练迁移:在测试集类别与训练数据零重叠(0%)或极低重叠(<2%)时仍保持优异表现

实验成果

对比模型 F-score提升幅度
传统GNN聚类方法 +49%
无监督学习方法 +47%

当前研究正探索构建通用聚类模型,以实现在人脸、动物物种等不同数据类型间的迁移聚类能力。

更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
公众号二维码

http://www.sczhlp.com/news/804.html

相关文章:

  • java第二十八天
  • 二叉树 (动态规划)
  • 1 引言(1.1 - 1.5)
  • 支持向量机算法
  • 决策树算法
  • 逻辑回归算法
  • static关键字--main函数
  • 长文!推荐‑搜索‑广告系统评估指标与损失函数技术报告
  • 集成学习算法
  • K 近邻算法
  • CVE-2020-13945 Apache APISIX 默认密钥漏洞 (复现)
  • 1 引言(1.6)
  • 可并堆(左偏树)
  • 7-28
  • DAY24
  • 2025 ZR暑假集训 CD联考 Day2 E 环球旅行
  • zk后集训
  • 乘法逆元(部分施工)、exgcd
  • 夏令营Ⅲ期
  • centos8.2 挂载本地镜像作为yum源
  • 非常值得学习渲染入门的一个教程
  • HDU 多校 2025 R3
  • 7.28SAM后缀自动机,回文自动机
  • Linux开机自动登录的一种方法
  • day5
  • JAVA语言学习总结(第27天)
  • CVE-2021-45232 Apache APISIX Dashboard身份验证绕过漏洞 (复现)
  • IIS中配置HTTPS证书的详细步骤
  • Python入门学习(七)高级部分:正则表达式
  • 在运维工作中,如果运行的一个容器突然挂了,如何排查?