基于监督学习的图像聚类新范式
传统机器学习模型依赖标注数据进行监督学习,而获取标注数据成本高昂。无监督学习的主要方法是聚类,即根据显著特征将数据点分组。传统聚类算法依赖启发式规则(如聚类中心距离阈值或分布形态)确定边界。在ICCV 2021发表的论文中,我们提出从数据中学习边界划分的方法。
技术架构
-
图表示构建
- 使用元训练数据训练监督分类器(编码器-解码器结构)
- 仅保留编码器将图像转换为特征向量
- 基于特征空间构建k近邻图,节点代表图像
-
层次化图神经网络(Hi-LANDER)
- 基础模型LANDER(链接近似与密度估计优化):
- 通过GNN生成节点嵌入
- 联合预测节点链接(同类别连接)和局部数据密度
- 层次化处理:
- 首轮聚类后将簇聚合为超节点
- 迭代执行近邻连接和GNN处理直至无新边产生
- 基础模型LANDER(链接近似与密度估计优化):
核心创新
- 双目标联合训练:首次在单一模型中同时优化链接预测和密度预测任务
- 全图处理机制:突破传统子图划分限制,实现全局信息流动
- 元训练迁移:在测试集类别与训练数据零重叠(0%)或极低重叠(<2%)时仍保持优异表现
实验成果
对比模型 | F-score提升幅度 |
---|---|
传统GNN聚类方法 | +49% |
无监督学习方法 | +47% |
当前研究正探索构建通用聚类模型,以实现在人脸、动物物种等不同数据类型间的迁移聚类能力。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
公众号二维码