spss 关联关系挖掘算法

广义规则归纳(GRI)节点会发现数据中的关联规则。例如,购买了剔须刀和客户在购买须后水之后,还可能会购买剔须霜。GRI基于某项指数抽取了信息量最大的规则,此指数考虑了规则的普遍性(支持度)和准确性(置信度)。GRI可以处理数值型和分类型输入,但目标必须是分类型。

Apriori节点从数据抽取一组规则,即抽取信息内容最多的规则。Apriori节点提供五种选择规则的方法并使用复杂的索引模式来高效地处理大数据集。对于大问题而言,Apriori通常用于训练时比GRI处理速度快;它对可保留的规则数量没有任何限制,而且可处理最多带有32个前提条件的规则。Apriori要求输入和输出字段均为分类型字段,但因为它专为处理此类型数据而进行优化,因而处理速度快得多。

序列节点可发现连续数据或与时间有关的数据中的关联规则。一个序列指趋向于以可预测的顺序发生的项目集合的列表。例如,一个购买了剃刀和须后水的顾客可能在下次购物时购买剃须膏。序列节点基于CARMA关联规则算法,该算法使用有效的两步法来发现序列。

交易数据格式:

消费者购买商品

1果酱

2牛奶

3果酱

3面包

4果酱

4面包

4牛奶

Apriori、CARMA和序列节点都可使用交易数据。GRI不支持

表格数据格式:

消费者果酱面包牛奶

1TFF

2FFT

3TTF

4TTT

Apriori、CARMA、GRI和序列节点都可使用表格数据。

GRI节点还可以处理多个输出字段。与Apriori不同,GRI可以处理数字输入字段也可以处理符号输入字段

相关推荐