中关村在线

软件

R软件关联分析入门

关联分析在实际中应用广泛,例如顾客在超市购物时,购买某商品常伴随另一商品的购买,两者可能存在某种联系。通过挖掘这种关联关系,有助于优化资源配置,提升销售业绩。利用R语言中的arules包,可高效实现关联规则的挖掘与分析,为决策提供数据支持。

1、 通过代码或R软件菜单安装并加载arules与rattle程序包,操作简便,便于后续数据挖掘分析任务的顺利开展。

2、 以早餐食品销售数据为例,ID代表客户编号,goods表示商品种类。通过table函数可统计每位顾客购买的食品类别,结果中1代表已购买该产品,0则表示未购买,直观展示客户的购买情况。

3、 代码如下所示

4、 查阅数据信息

5、 关联规则所需数据为事务形式,返回结果由10行7列构成。

6、 转换数据集格式

7、 在构建模型时,需调用函数apriori(data, parameter = NULL, appearance = NULL, control = NULL)。其中,data为以transactions格式组织的数据集,用于挖掘频繁项集。parameter参数用于设定算法的基本阈值,包括最小支持度(support),通常设为0.1,以及最小置信度(confidence),默认值一般为0.8,这两个指标共同决定关联规则的有效性。appearance参数可用于限定项在规则中的出现位置,例如仅出现在前件或后件中,每一项对应一种具体商品。control参数则用于调整算法的运行行为,如控制输出结果的排序方式、计算效率及显示选项等,从而优化模型执行过程。通过合理配置这些参数,能够有效提升关联规则挖掘的准确性与实用性,适用于零售、推荐系统等多个场景。

8、 构建关联规则模型

9、 查看模型输出结果

10、 查看模型输出,选取置信度最高的前五个结果,其中lift代表提升度,count代表出现次数。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具