粗糙集理论的主要优势之一是它不需要任何预备的或有关数据信息,比如统计学中的概率分布,或者模糊集理论中的隶属度或概率值。当然与其他数学理论一样,粗糙集理论也不是万能的。对建模而言,尽管粗糙集理论对知识不完全的处理是有效的,但是,由于这个理论未包含处理不精确或不确定原始数据的机制,因此,单纯地使用这个理论不一定能有效地描述不精确或不确定的实际问题,这意味着,需要其他方法来补充。一般地说,由于模糊集理论具有处理不精确和不确定数据的方法(尽管在描述上不一定方便),因此,将它与粗糙集理论构成互补是自然的考虑。
什么是粗糙集理论
在经典集合论中,元素对集合的关系是要不属于(取真值1),要不不属于(取假值0),二者必有其一。但在现实生活中有许多含糊现象并不能简单地用真、假值来表示,如何表示和处理这些现象就成为一个研究领域。
1965年,A. Zadeh提出了模糊集,不少理论计算机科学家和逻辑学家试图通过这一理论解决含糊概念,但遗憾的是模糊集是不可计算的,即无法计算出它的具体的含糊元素数目。1982年,波兰数学家Z. Pawlak提出了粗糙集(rough set,简称为RS)。
在粗糙集中,Z. Pawlak通过上近似集和下近似集的差集描述含糊元素数目,使得间于真假二值之间的含糊度可以计算。粗糙集理论主要特点在于它恰好反映了人们用粗糙集方法处理不分明问题的常规性,即以不完全信息或知识去处理一些不分明现象的能力,或依据观察、度量到的某些不精确的结果而进行分类数据的能力。
20世纪80年代以来经过许多计算机科学家和数学家的不懈努力,RS已经从理论上日臻完善,特别是由于20世纪80年代末和90年代初在知识发现等领域得到了成功的应用而越来越受到国际上的广泛关注。相对于其他处理不确定性和模糊性的理论工具而言,RS理论有着许多不可替代的优越性。
经过近几年的研究和发展,它已经在信息系统分析、人工智能及应用、决策支持系统、知识与数据发现、模式识别与分类、故障检测等多方面取得了较为成功的应用。