企业公告

内乡县夏馆镇吴岗中心小学:新学期开展入户家访活动 淅川县厚坡一中:战疫情送试卷_开云体育ios/安卓版/手机版app下载 开云体育官方网址-2014北师大二附中(三帆中学)招生简章 2014通州潞河中学特长生招生简章_开云体育官方网址 【开云体育ios/安卓版/手机版app下载】2018重庆星辰中学招生报名-重庆小升初 山顶找信号 夜里改作业——这位武汉回乡小学老师大山里开启直播课_开云体育ios/安卓版/手机版app下载 开云体育ios/安卓版/手机版app下载|上集镇镇直小学:强化安全意识提高安全素养 濮阳市范县龙王庄镇蔡庄小学举行“庆元旦迎新年”活动 铝城小学举行“爱在铝城”公益捐助活动【开云体育ios/安卓版/手机版app下载】 【开云体育ios/安卓版/手机版app下载】西峡县西坪镇豫边小学:关注贫困学生,开展帮扶活动 开云体育ios/安卓版/手机版app下载|上街区外国语小学校医孙鹏对教师进行疫情防控知识培训 2013上海小升初:上海虹口区小升初详解_开云体育官方网址 开云体育ios/安卓版/手机版app下载-南京市雨花台区各公办初中施教范围汇总 开云体育ios/安卓版/手机版app下载-珍爱生命,预防溺水——方城县独树镇小开展防溺水安全教育活动 开云体育ios/安卓版/手机版app下载_2015重庆巴蜀中学小升初择校费-2015重庆小升初 母婴闲置交易平台“花粉儿”获数千万A轮融资,将用于团队搭建和C2B2C业务 开云体育ios/安卓版/手机版app下载:作市九里山小学开学第一课开展“我和祖国共成长”主题教育活动 平顶山外国语学校迎接市意识形态工作督查 威创股份拟收购儿童剧龙头小橙堡100%股权,拓展亲子文化市场 内乡县灌涨中心小学确保“空中课堂”不缺一项不漏一人_开云体育ios/安卓版/手机版app下载

数据挖掘中的关联规则挖掘算法

作者: 开云体育·(中国)官方网址   时间:2022-12-07   浏览:75848

本文摘要:关联规则按照有所不同的标准,能用各种有所不同的方法分为有所不同类型。

关联规则按照有所不同的标准,能用各种有所不同的方法分为有所不同类型。将关联规则分成挖出频密项集、紧频密项集、被约束频密项集、很大频密项集,是根据挖出模式的完全性分类的;将关联规则分成多层和单层关联规则,以及单位和多维关联规则是根据规则所牵涉到的数据展开分类的;将关联规则分成分析关联规则和挖出布尔型规则是根据规则处置值类型分类的;将关联规则分成序列模式挖出、频密项集挖出以及结构模式挖出是根据俄关联规则挖出模式展开分类的;将关联规则分成兴趣度约束、科学知识类型约束、数据约束,是根据规则所挖出的约束类型分类的。关联规则挖出算法分析1Apriori算法分析关联规则算法中的挖出几乎频密项集中于,Apriori算法该类型中最具备应用于价值,影响力仅次于的算法。Apriori算法主要有两个步骤:(1)找到所有的频密集;(2)分解强劲关联规则。

在Apriori算法中的第一步是尤为最重要的步骤,该算法的核心思路是,等价一个数据库,在第一次数据库扫瞄中找到所有反对度小于相等大于反对度的项目构成频密1—项集,也就是L1,1—项集C1,由L1展开相连获得;接着展开第二次数据库扫瞄,将C1中所有反对度小于相等大于反对度的项集构成频密2—项集,也就是L2,候选2—项集C2由L2相连获得。以此类推,直到找到仅次于项频密集。即在展开第N次数据库扫瞄时,找到CN-1中所有反对度小于相等大于反对度的项集构成频密N—项集,即是LN,N—项集CN要由LN相连得出结论,仍然到敢说新的全集为止。在这里还要中用Apriori算法性质,即是频密项集是频密项集的子集,非频密项集所谓频密项集的超集。

开云体育ios/安卓版/手机版app下载

在Apriori算法中对数据库的扫瞄次数必须小于仅次于频密项集的项数。Apriori算法的操作者具备两个显著的缺点:(1)该算法的用于必须对数据库展开多次扫瞄,因此在读写操作上不会花费很多的时间,从而减少挖出算法的时间成本,这种成本的减少不可小觑,因为它是有数据库存储数据的减少,以几何级数下降的成本;(2)Apriori算法不会经常出现众多的候选频密集,时有发生集的产生量在每一步都相当大,这不会使算法在普遍度和了解度上的适应性较好。2FP—growth算法分析FP—growth算法是关联规则算法中归属于深度优化的一种算法,这种算法是深度优化算法中较新的且具备较高效益的,不同于Apriori算法本质的常用算法。

FP?—growth算法的基本基本步骤有两个:(1)再行将频密模式树FP—tree分解;必须将项集关联信息保留住,并使用一棵频密模式树根(FP—tree)用来容纳传输后的数据库;(2)在分解的FP—tree频密模式树中搜寻频密项集:再行将传输后的FP—tree再行集中为几个小的条件数据库,再行分别对这些数据库展开信息挖出。FP—growth算法相比于Apriori算法,只必须对数据库展开两次扫瞄,不必须多次扫瞄,大幅增加了挖出算法的时间成本;也会经常出现大量的候选项集,大幅增加了频密集的搜寻空间。也就是说FP—growth算法能明显提高时间和空间效率。

但是该算法也有缺点,在对可观且牢固的数据库展开挖出处理过程中,不管是递归计算还是信息挖出都必须占有大量的空间。两种算法都还不存在各自必须改良缺点,怎样在挖出过程中提升挖出效率,符合人们对挖出系统的市场需求,这将是数据研究工作者依然必须突破的重难点。


本文关键词:开云体育官方网址,开云体育ios/安卓版/手机版app下载

返回首页