伪回归问题:什么意思、举例说明
“伪回归”中的“伪”指的是虚假相关关系。
我们在衡量两组数据是否有相关关系的时候,无非就是将它们放在一起画一张散点图,计算相关系数,然后得出是否有线性相关关系。
其实我们并没有告知软件这两组数据的定义。
换句话说,如果我们将树木高度与中国GDP放在一起进行相关分析,那么也能得到一个很高的相关系数,但事实是,二者之间没有任何关系。
但在有些时候,“伪回归”的存在是由于思维的定式和逻辑的漏洞引起的,并非故意而为,所以“伪回归”不仅考量我们的科学道德,而且还考量我们的逻辑思维能力。