现实生活中,由于研究对象的复杂性、对事物认识的不断加深以及随机抽样的时间性,要使某些随机变量满足某种给定的密度函数已经变得越来越难以实现。这就需要人们能够通过从随机变量中抽取样本来研究随机变量的密度分布形态。
非参数密度估计,是随机变量 x 服从一未知的概率密度函数 f ( x ), f ( x )在这里只是一个记号,并没有任何具体的形式,要利用从 x 中抽取的简单样本 x 1 ,…, x n ,对函数 f ( x )进行估计,其之所以被称为“非参数”,是因为它不能通过设定有限个参数来确定。
三种常见的非参数密度估计的方法:直方图、核密度估计、 K 近邻估计。