为什么说数学好未必能学好统计学呢?
首先,数学讲究严密的逻辑演绎,而统计学则更多的是归纳推理。比如,通常人们认为,统计结论都应该建立在数据服从正态分布的基础之上,但很多数据仅仅是近似服从。这么宽泛的条件,怎么能得到让人信服的结论?笔者试图用大数定律和中心极限定理来验证结论的可信度,但事与愿违。其中的矛盾就在于统计学往往更注重应用。在实际应用中,数据是无法达到完美的理论要求的,适当地放宽和采用近似方法反而更能够接近真相。
其次,市面上种类繁多的统计软件,让那些不擅长数学的人也可以掌握统计学的知识。常用的统计软件有:龙头老大——SAS;后起之秀——R;新手福音——SPSS;擅长面板数据计量分析的Stata/MATLAB;计量入门小能手Eviews;数据挖掘方面也有Clementine、Python等。
如果你不想深入研究,只想利用统计学来解决一些非统计专业领域的难题,那么,大可不必选择高深的软件,拥有菜单操作的SPSS甚至Excel都可以满足你的统计需求。是的,只需轻轻地单击一下,结果自然呈现。但前提是你必须知道结果的含义,也知道如何选择正确的统计方法。
但如果你想要专业一些,那么还是需要学习R、SAS和Python的。R、SAS、Python是目前比较热门的软件,通常金融类企业需要处理海量数据,SAS使用频繁,而且较为权威;R是免费开源的,包含各类程序包,所以现在很多分析公司也会采用R作为主要软件,也有很多编程爱好者喜欢研究R,如果你的工作偏向于数据分析类,那么SAS和R可以任取其一;如果你的工作偏向于数据挖掘方向,那么可以考虑选择Python,它的应用面非常广。
学习统计软件的过程不仅仅是为了简化运算,也不单单是为了建模。笔者之所以喜欢统计,很大一部分原因在于在学习这些软件的同时加深了对统计思想的理解。笔者通常会把数据在各类统计软件里执行一遍,看结果会有何不同;也会试着用不同的检验方法检验同样的数据,如使用参数检验和非参数检验,再来对比一下结果有何不同。尤其是在进行多元统计分析的时候,如进行聚类分析,不同的数据处理方法会带来完全不同的结果。这类小实验给笔者的统计学习带来很大的乐趣。
统计学是一门探索的学科,一百个人做同一个统计研究可能得出一百个结论。但同样的,统计学也带给你更多的提问机会。学好统计学并不难,只要你喜欢问为什么,也喜欢去回答为什么就可以了。
笔者认为统计学有着“中庸”之美!“中庸”并非数学中的中项,恰恰是精确可计的两端的平均数,它随着环境的改变而改变,并且只对成熟且有灵活性的理性才显露自身。精度与费用之间的平衡就是“中庸”的体现。要知道,误差是统计学的一个特征,如果你不能跳出这个思维限制,过度纠结于理论的严苛条件,那么就很难学好统计学了。
统计学还有着“哲学”之美!它是一种由经验到理性的认识,是一种运用偶然性来发现规律性的科学。偶然中蕴含着必然,这属于统计学的哲学美,这个美的最佳体现就是大数定律。