概念分层可以用来把数据变换到多个粒度值,下面是4种标称数据的概念分层的产生方法。
(1)由用户或专家在模式级显式地说明属性的部分序。通常分类属性或维的概念分层涉及一组属性,用户或专家在模式级通过说明属性的部分序或全序,可以很容易地定义概念分层。
(2)通过显式数据分组说明分层结构的一部分。这基本上是人工定义概念分层结构的一部分。在大型数据库中,通过显式的值枚举定义整个概念分层是不现实的,然而对一小部分中间层数据,我们可以很容易地显式说明分组。
(3)说明属性集,但不说明它们的偏序。用户可以说明一个属性集,形成概念分层,但并不显式说明它们的偏序,然后系统可以试图自动地产生属性的序,构造有意义的概念分层。由于一个较高层的概念通常包含若干从属的较低层概念,定义在高概念层的属性与定义在较低概念层的属性相比,通常包含较少数目的不同值。根据这一事实,可以根据给定属性集中每个属性不同值的个数,自动地产生概念分层。具有最多不同值的属性放在分层结构的最低层。一个属性的不同值个数越少,它在所产生的概念分层结构中所处的层就越高,在许多情况下,这种启发式规则都很有用。在进行分层之后,在必要的情况下,局部层次交换或调整可以由用户或专家来做。
(4)只说明部分属性集。在定义分层时,用户可能只对分层结构中应当包含什么有一个很模糊的想法,或者说用户在分层结构的说明中只包含了相关属性的一部分。这时,为了处理这部分说明的分层结构,要在数据库模式中嵌入数据语义,使语义密切相关的属性能够在一起。利用这种办法,一个属性的说明可能会触发整个语义密切相关的属性被“拖进”,形成一个完整的分层结构。然而必要时,用户可以忽略这一特性。
总之,模式和属性值计数信息都可以用来产生标称数据的概念分层,使用概念分层变换数据使得较高的知识模式可以被发现。