二手数据的相关性和准确性
二手数据的相关性,是指二手数据与市场调查与预测所需要信息的关联程度。
可以从四个方面来判断或评估二手数据的相关性:
第一,测量单位是否相同?
考虑二手数据与市场调查与预测所需要数据之间在测量单位上的一致性程度;一致性程度越高,二手数据的相关性越好。比如,一个零售商在作出某一项决策之前,需要了解交易区域内居民的特点。虽然关于一个市或一个县的类似数据可以找到,但数据所涉及的范围或单位与这个零售商所要求的不同。因此,二手数据缺乏相关性。
第二,是否替代数据?
替代数据经常被用来代替市场调查与预测所欲求的数据。比如,一家手表厂为了推出一款新型电子表,需要有关西安市前一年电子表销售量的信息。这时,如果它得到了西安市十家最大零售商(按销售额计算)前一年电子表的销售数据,并用这个数据进行推测,那么它就使用了替代数据。因为西安市出售电子表的绝非就是这么几家商店,所以用这一替代数据推断或预测西安市电子表的销售量,就缺乏相关性。
第三,分类是否相同?
考虑二手数据与市场调查与预测所需要数据之间在分类方面的一致性程度;一致性程度越高,二手数据的相关性越好。比如,一个企业想专门为8—12岁的儿童生产一种新产品,因此需要了解他们的偏好,而这时却没有8—12岁儿童偏好的数据,只有5—9岁和10—14岁的数据。如果这个企业应用这些数据来进行推断或预测,相关性就存在问题。在市场调查与预测中,二手数据经常会在社会阶层、年龄、收入、公司大小等分类方面与要求不一致。
第四,时间是否合适?
一般而言,市场调查与预测使用的数据越靠近当前越好,而绝大部分二手数据都是过去的,有时甚至是过去好几年的。这时,即使其他方面在相关性方面问题不大,但是在时间上也有问题。比如,几年以前关于中国零售业态的调查数据,就无法用来描述中国目前的零售业态状况,因为从2000年到2006年中国零售业态的变化非常大,也非常快 。
二手数据如果存在以上四个方面的问题,就会降低其相关性。这是在应用二手数据时需要特别注意的。
在应用二手数据之前,还要考虑数据的准确性。使用二手数据的一条基本原则是:如有可能,尽量使用最初报道的数据。
这样做的道理有二:
第一,通常最初报道的数据比转引的数据更全面;它常常包括转引省略掉的警告、缺点和方法的详细说明。比如,国家统计局发布的数据都有关于误差的说明,而在这些数据被引用时,一般都不提误差。
第二,使用最初报道的数据,使用者可以根据要求重新考察它们,从而能够更好地判断数据的相关性或适用性。