数据挖掘九律(转)

第一,目标律。数据挖掘是一个业务过程,必须得有业务目标。无目的,无过程。

第二,知识律。业务知识贯穿在挖掘这个业务过程的各环节。

第三,准备律。数据获取、数据准备等数据处理耗时占整个挖掘过程的一半。

第四,NFL律。NFL,没有免费的午餐。没有一个固定的算法适用所有的业务问题,特定应用适合的模型只能通过经验发现。

第五,大卫律。要相信,数中必有业务规律。大卫?沃尔金斯最早提出的,故此名。

第六,洞察律。数据挖掘本质上是增强对业务领域的认知。

第七,预测律。数据挖掘基于过去得出模式,并泛化到类似新事物上,这就是预测,但这是统计概念的。

第八,价值律。挖掘模型的最终价值并非模型精度或稳定性,而是驱动业务行动或通过新洞察导致策略改善。

第九,变化律。人不会两次踏入同一条河流。业务在变,目标在变,认识也在变,甚至规律本身也在变,挖掘模型也得与时俱进。

相关推荐