如何用k均值聚类算法检测网络异常入侵？

快乐的鱼儿学敲码

2018-06-19

目的

这是一次通过执行k均值聚类来检测网络入侵的尝试

这个过程需要五步。我们要从没有聚类的非标记数据开始。算法创建了这个非标记数据的聚类。假设你想要计算错误和梯度下降，但是你没有这样做，在这种情况下你能做什么？这就是无监督学习开始发挥作用原因。

让我们开始吧！k是我们想要的聚类数目。然后我们将k的质心放在随机位置上。

它是如何工作的？

这个算法是一个迭代过程。本文将在图像的帮助下逐步解释它。

考虑下面的一组数据。我们需要将这些数据分成两组。

如何用k均值聚类算法检测网络异常入侵？

步骤1:算法随机选择两个质心c1和c2（有时，任何两个数据都作为质心）。

步骤2:它计算从每个点到两个质心的距离。如果测试数据更接近c1，那么该数据标记为'0'。如果它更接近c2，则标记为'1'（如果有更多的质心，标记为'2'，'3'等）。在我们的例子中，我们将用红色标记所有'0'，'1 '用蓝色标记。所以我们在进行上面的操作之后可以得到以下图像：

如何用k均值聚类算法检测网络异常入侵？

步骤3: 接下来，我们分别计算所有蓝色点和红色点的平均值，这个值将是我们的新质心。那就是c1和c2转移后的新质心。（请记住，所显示的图像不是真正的值，也不是真正的比例尺，它仅用于演示）。再次，执行步骤2，新质心和标记数据为'0'和'1'。

所以我们得到如下结果：

如何用k均值聚类算法检测网络异常入侵？

现在，迭代步骤2和步骤3，直到两个质心停止移动到固定点。（或者根据考验我们提供的标准，例如迭代的最大次数，或者达到特定的精度等等，它都可能会停止。）这些点是测试数据与它们对应的质心之间的距离的最小总和。

如何用k均值聚类算法检测网络异常入侵？

最终结果几乎如下所示：

如何用k均值聚类算法检测网络异常入侵？

这只是对K均值聚类的直观理解，更多解释。如果我们已经知道它可以被分为三种类型，那么k = 3。但是如果我们不知道有多少分类可能是与数据，所以我们使用肘形方法。肘形方法的概念是运行k数据集后的k值的范围（例如，在上面的例子中k从1到10），并且计算平方误差总和（SSE）。就像这个：

如何用k均值聚类算法检测网络异常入侵？

上述k均值聚类的算法，因为我们需要建立我们的算法，所以它将接收参数：

我们应该什么时候使用它？

但是你的数据是数字。它不适用于分类功能。我们要计算实数之间的距离！

如果你没有数据标签

K均值聚类是最简单的。实施运行中，你只需选择"k"并多次运行即可。

当你有多元数据时，K均值聚类和其他聚类算法会"发光"。它们将与一维数据共同"工作"。

当你想了解你的空间中实际存在多少个聚类时，这是很有用的。

其他例子

https://github.com/georgymh/ml-fraud-detection（欺诈检测）

https://github.com/Datamine/MNIST-K-Means-Clustering/blob/master/Kmeans.ipynb（MNIST无标签（最后））

如何用k均值聚类算法检测网络异常入侵？

k聚类算法通过需要上述步骤，因为我们需要构建我们的算法，所以它将接收为参数：

· K：群集数量（必需）

· epsilon：在停止条件下使用的最小错误（可选，默认== 0）

· 距离：该方法用于计算距离（可选defalut == 0）并返回：

· 质心

· 质心的演变历史

· 每个实例的成员向量具有其各自的质心

如何用k均值聚类算法检测网络异常入侵？

如何用k均值聚类算法检测网络异常入侵？

如何用k均值聚类算法检测网络异常入侵？

如何用k均值聚类算法检测网络异常入侵？

如何用k均值聚类算法检测网络异常入侵？

如何用k均值聚类算法检测网络异常入侵？

质心聚类网络入侵 k均值聚类算法

快乐的鱼儿学敲码

0 关注 0 粉丝 0 动态

相关推荐

k-means和iosdata聚类算法在生活案例中的运用

所以，本篇博客主要是对生活中的案例，运用k-means算法和isodata聚类算法进行数据评价和分析。本文是对“中国男足近几年在亚洲处于几流水平？”的问题进行分析。按照样本之间的距离大小，将样本集划分为K个簇。

lixiaotao 2019-10-28

聚类分析（二） K-MEANS

算法属于划分方法中的一种。是利用距离来量化相似度的，所以我们这里可以理解为是“将它们指定到离最近最近距离的质心所属类簇”）。然后重新计算质心位置。以上过程不断反复，直到准则函数收敛为止。通常采用平方误差准则，定义如下：。代表的意思是所有类簇中各对象到其所属

Oudasheng 2012-12-27

Python聚类算法之基本K均值实例详解

本文实例讲述了Python聚类算法之基本K均值运算技巧。分享给大家供大家参考，具体如下：。每次循环中，每个点被指派到最近的质心，指派到同一个质心的点集构成一个。重复指派和更新操作，直到质心不发生明显的变化。points = [[int, int] for

Python探路者 2015-11-20

[转] EM算法总结

EM算法也称期望最大化算法，它是一个基础算法，是很多机器学习领域算法的基础，比如隐式马尔科夫算法， LDA主题模型的变分推断等等。本文就对EM算法的原理做一个总结。　　　　我们经常会从样本观察数据中，找出样本的模型参数。最常用的方法就是极大化模型分布的对数

wonner 2020-05-05

机器学习基础：kmeans算法及其优化

对于给定的样本集，按照样本之间的距离大小，将样本集划分为K个簇。让簇内的点尽量紧密的连在一起，而让簇间的距离尽量的大。先初始k个簇的质心；然后分别求样本中所有点到这k质心的距离，并标记每个样本的类别为和该样本距离最小的质心的类别；重复以上两步，如果所有的

jiayuqicz 2020-04-25

算法 - k-means算法

所谓聚类算法是指将一堆没有标签的数据自动划分成几类的方法，属于无监督学习方法，这个方法要保证同一类的数据有相似的特征，如下图所示：

蜗牛慢爬的李成广 2019-11-09

opencv python Meanshift 和 Camshift

MeanshiftMeanshift 算法的基本原理简单,假设我们有一堆点，和一个小的圆形窗口，Meanshift 算法就是不断移动小圆形窗口，直到找到圆形区域内最大灰度密度处为止.meanshift in OpenCV首先要设定目标，并计算的直方图，然后

wandaxiao 2019-06-28

一个完整的K-means聚类算法指南！

假设您想根据内容和主题对数百（或数千）个文档进行分类，或者您希望出于某种原因将不同的图像组合在一起。目标是获得尽可能相似的同一组中的数据点，并使不同组中的数据点尽可能不相似。K-means非常适合探索性分析，非常适合了解您的数据并提供几乎所有数据类型的见解

风吹夏天 2019-05-21

机器学习基础-EM算法

EM算法也称期望最大化算法，它是一个基础算法，是很多机器学习领域算法的基础，比如隐式马尔科夫算法， LDA主题模型的变分推断等等。本文就对EM算法的原理做一个总结。从上面的描述可以看出，EM算法是迭代求解最大值的算法，同时算法在每一次迭代时分为两步，E步和

natloc 2019-05-02

Kmeans算法的Python实现（内附python教程分享）

K-means算法是很典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。该算法认为簇是由距离靠近的对象组成的，因此把得到紧凑且独立的簇作为最终目标。当考察完所有数据对象后，一次迭代运算完成，新的聚类中心被计算

xiaoxixi 2019-03-19

K均值聚类知识点大全：算法、应用、评估方法和缺点

聚类是一种最常用的探索性数据分析技术，用于直观地了解数据的结构。换句话说，我们试图在数据中找到同质的子组，使得每个聚类中的数据点根据相似性度量尽可能相似。决定使用哪种相似性度量是特定于应用程序的。与监督学习不同，聚类被认为是一种无监督学习方法，因为我们不具

ustbfym 2018-09-19

“蜘蛛侠”要完！伯克利、斯坦福的机器人一言不合就爬墙

开门、踢足球、后空翻、杂技表演，这年头还有什么是机器人做不到的！伯克利、斯坦福等高校已经相继研发出了爬墙机器人，飞檐走壁无所不能。今天，文摘菌就整理了这些爬墙机器人的档案。RSTAR由是UC Berkeley仿生微系统实验室在Negev Gurion大学研

Giisozs 2018-07-25

机器学习初学者的K-Means聚类算法概述

任何在google上搜索“数据科学”的人都可能看到过机器学习中的k-means聚类算法。K-means是一种简单但功能强大的分类工具，它根据相似的特征将数据分配到组中。例如，它可以用于根据电影标题和上映日期预测电影类型，或者根据客户的购买模式分类客户。现在

秋田小鼠 2018-10-19

机器学习中的K均值聚类：算法，应用，评估方法和缺点

聚类聚类是用于获得关于数据结构的直觉的最常见的机器学习中探索数据分析技术之一。它可以被定义为识别数据中的子组的任务，使得相同子组中的数据点非常相似，而不同clusters中的数据点非常不同。换句话说，我们试图在数据中找到同质子组，使得每个聚类中的数据点根据

一条鱼 2018-09-18

从头开始实现机器学习K-Means聚类

本文的目的不是详细解释机器学习中的K-Means聚类，是在不使用Scikit的情况下提供实现细节。K-Means是用于聚类的流行且简单的机器学习中无监督学习算法之一。K-Means中的超参数'K'指的是clusters的数量。K-Means是一种基于质心的

kunlong00 2018-09-15

利用机器学习进行皮肤分割和主色调/颜色提取

今天我们将学习使用OpenCV来分割皮肤并使用Sci Kit学习执行K-Means聚类以找到主要的肤色。假设您了解基本的python并了解OpenCV。我们将涵盖对K-Means和OpenCV的一些方法的高级理解。我们还将讨论不同的色彩空间。本文的重点是解

sunlinyi 2018-09-12

机器学习：Python实现K-MEANS聚集

k-means聚类是一种矢量量化方法，最初来源于信号处理，在数据挖掘中被广泛应用于聚类分析。k-means聚类的目的是将n个观测值划分为k个观测值，每个观测值都属于最接近均值的聚类，作为聚类的原型。这导致将数据空间划分为Voronoi单元。该算法与k最近邻

bamboocqh 2018-09-02

K均值聚类-机器学习算法简介和Python实现

在机器学习中，我们并不总是被提供一个目标来优化，我们也不总是被提供一个目标标签来分类输入数据点。在人工智能领域，没有目标或标签来分类的问题被称为无监督学习问题。在无监督学习问题中，我们试图对数据中潜在的结构化信息进行建模。聚类是一种非监督学习问题，我们试图

stevenkwong 2018-06-10

JavaScript实现计算多边形质心的方法示例

本文实例讲述了JavaScript实现计算多边形质心的方法。分享给大家供大家参考，具体如下：。area = p0.lng * p1.lat + p1.lng * p2.lat + p2.lng * p0.lat - p1.lng * p0.lat - p2

DIABLO0 2018-01-31

Python机器学习算法之k均值聚类（k-means）

一开始的目的是学习十大挖掘算法,并用编码实现一遍，但越往后学习，越往后实现编码，越发现自己的编码水平低下，学习能力低。下面的代码中这些可以优化的并没有改，这么做的原因是希望做到抛砖引玉，欢迎大家丢玉，如果能给出优化方法就更好了

香蕉麦乐迪 2018-02-23

快乐的鱼儿学敲码

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号