k均值算法
1). 扑克牌手动演练k均值聚类过程:>30张牌,3类
实验总牌数为30,分三类进行三轮迭代。
第一轮:抽取聚类中心为:3、4、7.
聚类结果为:
第二轮:经过求平均后,重新确定聚类中心为:2、4、10
第三轮:对上类再进行求平均,选定聚类中心为2、5、10
最终聚类中心稳定在2、5、10,以此为小中大划分。
2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题)
3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示.
代码:
散点图显示为:
4). 鸢尾花完整数据做聚类并用散点图显示.
代码:(经上代码修改来的,稍有瑕疵)
散点图:
5).想想k均值算法中可以用来做什么?
最主要的就是进行机器学习啊,再加上如今是大数据时代,数据足够训练模型简直如虎添翼,
应用到生活中的比如,手机上会自动帮你标记哪些是骚扰电话,就是通过许多用户的数据进行机器学习得到的,比如说童话时常,对用户接起来一秒挂断的电话进行记录,被很多用户一秒挂断,就标记是骚扰电话