DiAD:革新异常检测领域的新里程碑——首个基于扩散模型的多类检测框架</
浙江大学与腾讯优图联合开发的DiAD,是异常检测领域的一项重大突破。这款框架巧妙地利用Stable Diffusion技术,成功解决了多类异常检测中的类别识别和语义保留问题,MVTec-AD和VisA数据集的性能表现令人瞩目,一举超越了当前最先进的模型,如UniAD和RD4AD。
背景与挑战</
在工业生产中,高效准确的异常检测对于保证产品质量和生产安全至关重要。传统方法往往为每类异常单独训练模型,效率低下且无法处理类内多样性大的情况。DiAD的诞生,正是为了寻求一种通用的框架,能够在各类物体中识别异常,而无需过多的类别特定训练。
尽管扩散模型因其强大的生成能力广受关注,如DDPM和LDM,它们在多类异常检测中遇到的挑战包括类别混淆和保持语义一致性的问题。DDPM在去噪过程中容易将图像转变成随机噪声,而LDM虽解决了类别错误,但无法保证在去噪过程中保持图像的原始语义。DiAD正是在解决这些难题上的创新之作。
创新设计</
DiAD的网络结构包括语义引导网络和空间感知特征融合模块。语义引导网络在去噪过程中保持输入图像与重构图像的语义一致性,通过Semantic-Guided Network确保钉子的方向、齿轮的方位等关键信息的保留。而Spatial-aware Feature Fusion Block则整合不同尺度特征,提升模型的识别精度。
卓越成果</
在MVTec-AD和VisA数据集上,DiAD在图像和像素级别上分别展示了令人瞩目的AUROC、AP、F1max和PRO等七项指标,全方位超越了竞争对手。具体结果可见:
总结与未来</
DiAD的诞生,标志着在多类异常检测领域的一大跃进,它不仅解决了现有模型的局限,还展示了强大的异常区域重构能力。关注@CVer官方知乎账号,获取更多前沿的计算机视觉和AI工作动态,紧跟技术发展前沿。