现实生活中,由于研究对象的复杂性、对事物认识的不断加深以及随机抽样的时间性,要使某些随机变量满足某种给定的密度函数已经变得越来越难以实现。这就需要人们能够通过从随机变量中抽取样本来研究随机变量的密度分布形态。
非参数密度估计,是随机变量 x 服从一未知的概率密度函数 f ( x ), f ( x )在这里只是一个记号,并没有任何具体的形式,要利用从 x 中抽取的简单样本 x 1 ,…, x n ,对函数 f ( x )进行估计,其之所以被称为“非参数”,是因为它不能通过设定有限个参数来确定。
直方图是人们最熟悉和常用的一种简单、初等的非参数密度估计方法。
直方图密度估计的优点:
(1)概念简单,易于使用。
(2)不需要保留采样点。
(3)在样本容量较大、窗宽较小的情况下,所得的图象可以显示密度的基本特征。
直方图密度估计的缺点:
(1)直方图密度估计在高维空间很少有实效。
(2)直方图密度估计的结果是不连续的。
(3)直方图在双变量或者三变量数据的图形化表达方面存在很大的困难。
虽然直方图记录了在每个区间中点的个数或频率,使得图中的矩形条的高度随着数值个数的多少而变化,但是直方图很难给出较为精确的密度估计。