数据挖掘之FP-Tree算法速学详解

FP-TreeFP-tree算法的基本原理FP-tree算法实例1统计频率重新排序建立FP树挖掘频繁项集FP-tree算法实例2排序生成频繁模式树FP-Tree生成条件模式库构造C-FP-tree递归构造C-FP-treeFP-tree算法的基本原理Frequent Pattern Tree：进行2次数据库扫描：一次对所有1-项目的频度排序；一次将数据库信息转变成紧缩内存结构。不使用侯选集，直接压

持锤大吱佬

10793人浏览 · 2021-01-07 19:58:37

持锤大吱佬 · 2021-01-07 19:58:37 发布

FP-Tree

FP-tree算法的基本原理

Frequent Pattern Tree：进行2次数据库扫描：一次对所有1-项目的频度排序；一次将数据库信息转变成紧缩内存结构。

不使用侯选集，直接压缩数据库成一个频繁模式树，通过频繁模式树可以直接得到频集。

基本步骤是：
·两次扫描数据库，生成频繁模式树FP-Tree：

    ·扫描数据库一次，得到所有1-项目的频度排序表T；
    ·依照T，再扫描数据库，得到FP-Tree。

·使用FP-Tree，生成频集：

   ·为FP-tree中的每个节点生成条件模式库；
   ·用条件模式库构造对应的条件FP-tree；
   ·递归挖掘条件FP-trees同时增长其包含的频繁集：
        -如果条件FP-tree只包含一个路径，则直接生成所包含的频繁集。

FP-tree算法实例1

统计频率

在这里插入图片描述

重新排序

在这里插入图片描述

建立FP树

在这里插入图片描述

挖掘频繁项集

在这里插入图片描述

FP-tree算法实例2

排序

在这里插入图片描述

生成频繁模式树FP-Tree

在这里插入图片描述

生成条件模式库

为每个节点，寻找它的所有前缀路径并记录其频度，形成CPB
在这里插入图片描述

构造C-FP-tree

为每一个节点，通过FP-tree构造一个C-FP-tree
例如，m节点的C-FP-tree为：
在这里插入图片描述

递归构造C-FP-tree

在这里插入图片描述

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

Kimi K2.5 怎么在 OpenClaw 里配置？3 种接入方案实测对比（2026）

上周三公司一个做客服机器人的项目要换模型，产品经理说想试试 Kimi K2.5，理由是"中文理解能力强，而且便宜"。我寻思也行，正好手头在用 OpenClaw 做日常开发，就花了两天把几种接入方案都跑了一遍。结果嘛……有惊喜也有坑，记录一下。说实话一开始我以为改个 base_url 就完事了，没想到 OpenClaw 对不同 API 协议的兼容性差异还挺大的。这篇文章就把我实测的 3 种方案摆出来

DAMO开发者矩阵

医疗影像合规底座：WORM 与快照同步架构解析

医疗影像数据中心的建设，本质上是一场对抗碎小 I/O 磨损与合规审计压力的系统工程。该医院通过部署威联通架构，利用 QuTS hero 底层的 ZFS 内存聚合机制化解了机械硬盘的并发寻道危机；利用 WORM 合规模式确立了抵御勒索软件与内部越权的物理防线；并依靠 SnapSync 实现了不受文件规模制约的异地灾备。这套软硬一体的工程解法，将笨重的非结构化影像数据，重构为具备极高司法置信度与可用性