在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
本节书摘来自华章出版社《R语言数据挖掘》一书中的第2章,第2.5节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。2.5 R语言实现算法主要部分的R语言实现为: 2.5.1 SPADE算法使用等价类的序列模式发现(Sequential Pattern Discovery using Equivalent class,SPADE)算法是应用于序列模式的垂直序列挖掘算法,它采用深度优先策略。算法的特征是: SPADE算法是Apriori算法的扩展。 算法采用Apriori性质。 需要对初始事务数据集进行多次扫描。 采用垂直数据格式。 算法采用简单的连接运算。 所有序列的发现都需要对数据进行3次扫描。 下面是调用SPADE算法之前的伪代码 R语言实现算法主要部分的R语言代码实现是: 2.5.2 从序列模式中生成规则序列规则、标签序列规则和类序列规则都可以从序列模式中生成,这些可以从前面的序列模式发现算法中得到。 |
请发表评论