数据挖掘模型评估指标:Gain Chart
Gain Chart(增益图)主要用来评估模型的好坏。如图4-8所示,其中横轴为营销人数的百分比,纵轴为有回应人数的百分比。
点①表示在向所有客户进行营销的情况下,有回应人数的百分比为100%。图4-8中的直线表示随机挑选一定数量的客户进行营销活动时所对应的有回应人数的百分比数值,该直线的斜率为45°。
而曲线表示根据数据挖掘结果所得出的营销对象名单进行营销所得到的有回应人数的百分比数值。
根据图4-8所示的数据,假定营销人数被限定为总客户人数的20%,若随机挑选营销对象,则有回应人数的百分比为20%,若运用数据挖掘所得到的营销对象名单,则有回应人数的百分比为50%,后者是前者的2.5倍。
此外,若模型所生成的曲线的斜率越接近45º,则模型越差,而曲线越靠近左上角,则模型越好。通常情况下,我们根据曲线与横轴和纵轴围成的面积大小来判断模型的好坏,即图4-8中的区域②面积越大,模型越好,反之则模型越差。