感知器

的感知器是一个机器学习算法用于确定是否输入属于一个类或另一个。例如，感知器算法可以确定和运营商鉴于二进制输入 $x_1$ 而且 $x_2$ 是( $x_1$ 和 $x_2$ )等于0还是1?

$两个数字之间的与运算。红点代表一个类$(x_1$ AND $x_2 = 0)$，蓝点代表另一个类$(x_1$ AND $x_2 = 1)。$这条线是感知器算法的结果，它将一个类的所有数据点从另一个类的所有数据点中分离出来。$ 两个数字之间的与运算。红点代表一个类 $(x_1$ 和 $x_2 = 0)$ 蓝点代表另一个类 $(x_1$ 和 $x_2 = 1)。$ 这条线是感知器算法的结果，它将一个类的所有数据点从另一个类的数据点中分离出来。

感知器算法是最早的算法之一人工神经网络它是最常用的神经网络之一的构建模块多层感知器．

属性

感知器算法是在监督式学习，这是一个机器学习任务，有优势训练有素的带安全标签的数据。这与无监督学习，它是在未标记的数据上训练的。具体来说，感知器算法关注的是二元分类数据，是一个类或另一个类的成员的对象。此外，它还允许在线学习，这意味着它一次处理一个训练数据集中的元素(这对大型数据集很有用)。

二进制分类数据和分类器使用的决策边界的示例^[1]

此外，感知器算法是一种线性分类器，它通过使用变量的线性组合对数据点进行分类。如上图所示，线性分类器使用直线 $\大($ 如。 $H_1、H_2$ ,或 $H_3 \大)$ 要对数据点进行分类——线一侧的任何对象都是一个类的一部分，线另一侧的任何对象都是另一个类的一部分。在本例中，一个成功的线性分类器可以使用 $H_1$ 或 $H_2$ 区分这两个阶级，而 $H_3$ 会是一个可怜的决定边界．

感知器特性的一个有趣的结果是它无法学习异或函数!正如我们上面看到的，OR和and函数是线性可分的，这意味着存在一条线可以将一个类的所有数据点与另一个类的所有数据点分开。然而，XOR函数不是线性可分的，因此感知器算法(线性分类器)无法成功学习这个概念。这就是为什么感知器算法本身不用于复杂的机器学习任务的主要原因，而是可以处理线性不可分割分类的神经网络的构建块。

定义

感知器是一种用于产生二进制分类器的算法。也就是说，算法接受二进制分类输入数据，以及它们的类成员，并输出一条线，试图将一个类的数据从另一个类的数据中分离出来:该线一侧的数据点属于一个类，另一侧的数据点属于另一个类。

特别地，给定一个输入 $k$ 变量 $x_1、x_2……xk,$ ，直线是这些变量的线性组合: $W_1 x_1 + w_2 x_2 + \cdots + w_k x_k + b = 0$ ,在那里 $w_0, w_1,…, w_k$ 而且 $b$ 是常数。注意，这也可以写成 $\boldsymbol{w} \cdot \boldsymbol{x} + b = 0$ ,在那里 ${} {} \ cdot \ \文本文本$ 是点积两者之间的向量 $w \ boldsymbol {}$ 而且 $\ boldsymbol {x}$ ．

感知器算法返回的值 $w_0, w_1,…, w_k$ 而且 $b$ 这样，在线的一边的数据点是一个类，在另一边的数据点是另一个类。的数值 $w \ boldsymbol {}$ 而且 $b$ 二进制分类器以以下方式使用:If $\boldsymbol{w} \cdot \boldsymbol{x} + b > 0$ ，分类器返回1;否则，它返回0。注意，1表示一个类的成员关系，0表示另一个类的成员关系。使用AND运算符可以更清楚地看到这一点，为了方便起见，下面复制了它。

$两个数字之间的AND运算:一个红点代表一个类$(x_1$ AND $x_2 = 0)$，一个蓝点代表另一个类$(x_1$ AND $x_2 = 1)。$这条线是感知器算法的结果，它将一个类的所有数据点从另一个类的数据点中分离出来。$ 两个数字之间的AND操作:一个红点表示一个类 $(x_1$ 和 $x_2 = 0)$ 蓝点代表另一个类 $(x_1$ 和 $x_2 = 1)。$ 这条线是感知器算法的结果，它将一个类的所有数据点从另一个类的数据点中分离出来。

那么 $w \ boldsymbol {}$ 而且 $b$ 代表什么? $w \ boldsymbol {}$ 的权值 $k$ 变量。简单地说，变量的权重决定了直线相对于该变量的陡峭程度。每个变量都需要一个权重;否则，这条直线相对于该变量将是平坦的，这可能会阻止这条直线成功地对数据进行分类。此外, $b$ 代表了偏见的数据。本质上，这防止了直线依赖于起源 $（$ 点(0,0) $）$ -偏差将线向上或向下移动，以更好地对数据进行分类。

监督式学习

感知器算法通过随时间改变权重和偏差来学习分离数据，其中时间表示为算法运行的次数。因此, $\ boldsymbol {w (t)}$ 表示权重在时间上的值 $t$ 而且 $b (t)$ 表示时间偏差的值 $t$ ．

此外, $\α$ 代表了学习速率，即算法对变化的响应速度。这个值有界 $0 < \alpha \le$ ． $\α$ 不能为0，因为这意味着没有学习发生。如果 $\α$ 是一个较大的值，算法的倾向性有多大振荡围绕解决方案，如后面所述。

为了更好地阐明这些概念，下面详细介绍感知器算法的形式步骤。在下面, $d1$ 表示输入的正确输出值 $x_i$ ；一节课 $d1 = 1$ 如果 $x_i$ 是那个阶级的成员吗 $d1 = 0$ 否则。

首先设置 $\boldsymbol{w(0)}， b(0)， t = 0$ ．
对每个输入 $\ boldsymbol {x_i}$ ,确定 $\boldsymbol{w(t)} \cdot \boldsymbol{x_i} + b > 0$ ．让 $y_i$ 做输入的输出 $\ boldsymbol {x_i}$ (true为1,false为0)。
权重和偏差现在为算法的下一次迭代进行了更新: $\ boldsymbol {w (t + 1)} = \ boldsymbol {w (t)} + \α(d1 - y_i) \ boldsymbol {x_i}$ 而且 $B (t+1) = B (t) + \ (d_i - y_i)$ 对所有输入。
如果学习是离线(如果输入可以被扫描多次)，步骤2和3可以重复，直到错误最小化。注意: $t$ 在每次迭代时递增。

举例如下:

假设我们试图学习以下输入类对的AND操作符 $\大((x_1、x_2) d_i \大):$ $\大((0,0),0 \大),\大((0,1),0 \大),\大((1,0),0 \大),$ 而且 $\大((1,1),1 \大)。$ 让我们用学习率 $\α= 0.5$ 然后运行这个算法直到我们把四个点都正确分类。

W (0) = [0,0]， b(0) = 0

1 W (0) = [0,0]， b(0) = 0 Y = [0,0,0,0] W (1) = [0.5, 0.5]， b(1) = 0.5

2 W (1) = [0.5, 0.5]， b(1) = 0.5 Y = [1,1,1,1] W (2) = [0,0];(2) = 1

3. W (2) = [0,0]， b(2) = -1 Y = [0,0,0,0] W (3) = [0.5, 0.5]， b(3) = -0.5

4 W (3) = [0.5, 0.5]， b(3) = -0.5 Y = [0,0,0,1] 成功!

随时间变化的感知器算法。绿线表示感知器算法在第二次迭代后的结果，黑线表示感知器算法的最终结果(迭代4后)。

在前面的例子中，感知器算法终止很快就能得到正确的值。出现这种情况的一个原因是由于精心选择的学习率( $\α$ )．与一个较小的 $\α$ ，算法需要更多的迭代才能完成，而较大的 $\α$ 可能会导致算法永远振荡。

实现

感知器算法的实现如下(Python):

12 34 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37

和操作符的例子，如上所述α＝0．5input_data＝(((0，0),0)，([0，1),0)，([1，0),0)，([1，1),1）]权重＝［0，0］偏见＝0#开始算法def感知器（）：#重复操作，直到将错误最小化而真正的：#从t-1开始new_weights＝［我为我在权重］new_bias＝偏见对于每个输入数据点为input_datum在input_data：#添加斜线(截距比较＝偏见list_of_vars＝input_datum［0］#对于每个变量，计算行值为指数在范围（len（list_of_vars)):比较+ =权重［指数］＊list_of_vars［指数］#获取正确的分类和算法的分类correct_value＝input_datum［1］classified_value＝int（比较>0）#如果值不同，在权重和偏差中添加一个错误如果classified_value! =correct_value：为指数在范围（len（list_of_vars)):new_weights［指数］+ =α＊（correct_value-classified_value）＊list_of_vars［指数］偏见+ =α＊（correct_value-classified_value）#如果权重或偏差没有变化，返回如果new_weights= =权重而且new_bias= =偏见：返回（new_weights，偏见）

总结

感知器算法是二分分类中最常用的机器学习算法之一。一些使用感知器的机器学习任务包括确定性别、疾病的低风险与高风险以及病毒检测。基本上，任何涉及到两组分类的任务都可以使用感知器!此外,多层感知器使用感知器算法来区分不可线性分离的类，这增加了感知器可以使用的任务数量!

总的来说，感知器算法(及其背后的思想)是的主要构建模块之一神经网络对它的理解对于发展更复杂的网络至关重要。

参考文献

赛克。图形显示3个超平面在2D。H3没有分离这两个类。H1有，边际小，H2边际大。．检索于2016年5月26日https://en.wikipedia.org/wiki/Linear_classifier#/media/File:Svm_separating_hyperplanes.png

1	W (0) = [0,0]， b(0) = 0	Y = [0,0,0,0]	W (1) = [0.5, 0.5]， b(1) = 0.5
2	W (1) = [0.5, 0.5]， b(1) = 0.5	Y = [1,1,1,1]	W (2) = [0,0];(2) = 1
3.	W (2) = [0,0]， b(2) = -1	Y = [0,0,0,0]	W (3) = [0.5, 0.5]， b(3) = -0.5
4	W (3) = [0.5, 0.5]， b(3) = -0.5	Y = [0,0,0,1]	成功!

有关……

内容