什么是预测分析法:预测分析法的例子案例
预测分析法主要用于未知数据的判断和预测,这个方法在大数据时代显得尤为突出和重要,例如依据过往三年的历史销售数据,预测未来六个月的销售额;根据患者各项体检指标的检查,预测其患某种疾病的可能性;利用消费者在互联网留下的日志数据,向消费者推送可能购买的商品等。预测分析法大致可以划分为两种:一种是基于时间序列的预测,即根据指标值的变化与时间依存关系进行预测(具体的预测方法有移动平均法、指数平滑法、ARIMA法等);另一种是回归类预测,即根据指标之间相互影响的因果关系进行预测(具体的预测方法有线性回归、KNN算法、决策树模型等)。
下面通过一个简单的案例来阐述预测分析法的应用。假设影响某商品销售利润(Profit)的因素包含研发成本(RD_Sperd)、管理成本(Administration)和市场营销成本(Marketing_Spend),数据如图1-18所示,为部分数据。那么,如何基于这三个因素来预测商品的销售利润?
下面利用预测分析法中的线性回归模型(有关该模型的具体用法,读者可以参考本书第5章的内容),对数据进行建模,并基于模型实现商品销售利润的预测:
得出的结果如图1-19所示。
从上图结果可知多元线性回归模型的系数(图中方框内所示)。假设不考虑模型的显著性和回归系数的显著性,那么得到的回归模型可以表示为:
Profit =50120+0.81 RD _ Spend -0.03 Administration +0.03 Marketing _ Spend
所以,当已知三个因素的具体值时,就可以将它们的值导入到线性回归模型的方程式中,求得可能的商品利润。