数理统计是一门以概率论为基础的关于数据的收集、整理、分析和推断的数学学科,它通过对大量随机现象的观察、研究,以发现其内在规律性,并以此对其作出一定的判断和预测。
(一)数理统计的特性
首先,数据必须带有随机性的影响,才能成为数理统计学的研究对象。在数理统计中,研究的随机变量分布是未知的,只能通过对其进行大量的观察或试验,从得到的信息(如观察值等)中进行分析、找寻事件的发生规律,对随机变量的分布或特性作出种种推断。如考虑一个国家的全面人口普查,假定人力、物力、时间允许我们对国内每一个人的状况调查,而这种调查又是准确无误的,则我们可以利用普查所获得的数据通过既定的方法,把所感兴趣的指标计算出来。总之,数据是否具有随机性,是区别数理统计方法和其他数据处理方法的根本点。
数据的随机性来源有二:一是抽样的随机性,出于经济原因的考虑或时间的限制或问题性质决定。不可能或没有必要得到研究对象的全部资料,而只能用“一定的方式”抽取其中一部分进行考察。这样所得到的数据的随机性就是来自抽样的随机性;二是试验过程中的随机误差,即在试验过程中未加控制或无法控制或不便控制,甚至是不了解的因素所引起的误差。在实际问题中这两类随机性常常交织在一起。
其次,收集数据要用有效的方法。一是建立一个在数学上可以处理并尽可能简单方便的模型来描述所得数据,二是数据中要包含尽可能多的、与所研究问题有关的信息。
最后,有效地使用数据。就是要用有效的方法去集中和提取试验数据中的有关信息,对所研究的问题作出合理的、尽可能精确和可靠的结论。