箱线图由一个长方形箱子、箱子中间的竖线、外延出来的两条线及最外端可能有的表示异常值的点组成。
箱子中间的竖线表示该组数据的中位数,箱子两端分别代表了上四分位数(即75%的百分位数)和下四分位数(即25%的百分位数),外延线两端分别是最大值和最小值。
箱子中间包含了总体50%的数据。上四分位数和下四分位数之间的距离称为四分位数间距,即四分位差。如果一个数据与箱子两端间的距离超过四分位数间距的1.5倍以上,通常被认为是异常值。
如图3-27所示,箱线图中包含了一组数据的5个点:
最大值、上四分位数、中位数、下四分位数、最小值。

图3-27 箱线图