Python实现K-means聚类

电玩墨客

原创

06-04

K-means聚类是一种无监督学习方法，依据各样本在多个指标上的表现，按样本间距离划分为K个类别。本文将介绍如何使用Python实现聚类分析的步骤与技巧，帮助快速掌握该方法的应用流程。

1、使用pandas加载数据集，包含学生数学和英语两门课程的成绩信息。

2、引入机器学习库中的K均值聚类分析工具。

3、对训练集进行处理时，若数据包含分类结果，可将其作为目标变量。与逻辑回归不同，K-means聚类无需依赖y，仅使用X变量集即可完成模型训练，适用于无监督学习场景。

4、构建模型时，通过n_clusters参数设定分类数量K值，此处将样本划分为两个类别。

5、其余参数保持默认，可依实际需求调整。

6、训练模型，获取预测结果。

7、结果显示样本被清晰地划分为两个类别。

8、依据聚类结果绘制散点图。

9、样本量少且类别有限，导致聚类效果不够显著。

10、增加聚类数量并绘图展示。

11、从图形上看，聚类效果明显优于二分类。当样本量充足时，应结合实际情况和聚类表现合理选择K值。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



Microsoft Office 家庭版 2024

Microsoft Office 家庭版 2024

28人评分

96%好评

Microsoft 365 商业应用版

Microsoft 365 商业应用版

Microsoft Office 小型企业版 2024

Microsoft Office 小型企业版 2024

1人评分

100%好评

评论

更多评论

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具