什么？神经网络还能创造新知识？

cherry0

2019-06-28

全文共3243字，预计学习时长10分钟或更长

什么？神经网络还能创造新知识？

图片来源：Unsplash

神经网络(NNs)可以在不知道用显式算法执行工作的情况下被设计和训练于特定的任务，很多人都对此表示惊叹。例如，著名的手写体数字识别教程很容易执行，但其背后的逻辑还是隐藏在神经网络下，仅能通过层次化结构、权值和激活函数略知一二。

本文通过神经网络透明原则来揭示其“黑盒知识”，为此来检验一个布尔异或函数的神经网络。首先，利用已知异或属性过程构造了一个自底向上的神经网络，即清晰包含已知的代数关系。在第二步中使用TensorFlow Keras从简易图形化编程工具到异或逻辑运算训练神经网络。

最后比较两种方法。将Keras神经网络分解为布尔组件，发现逻辑设置与第一步中构造的神经网络不同。被训练的神经网络发现了使用不同布尔函数的另一种异或运算表示方法。

这另一种异或公式在数学领域不是未知的，但至少很新奇。这或许表明神经网络可以创造新的知识。但要提取它，必须能够将神经网络的设置和参数转化为显式规则。

什么？神经网络还能创造新知识？

自底向上构造异或运算神经网络（XOR NN）

异或运算是由映射定义的布尔函数，

XOR (0,0) = XOR (1,1) = 0

XOR (1,0) = XOR (0,1) = 1

为异或运算构造一个已知的神经网络或谷歌标识列

XOR (x,y) = AND ( NAND (x,y) , OR (x,y) )

这很有帮助，因为操作符AND、NAND(而非AND)和OR是众所周知的，并且都可以用简单的神经网络来表示，其中有2个输入和1个输出结点、偏移量和sigmoid激活函数。

什么？神经网络还能创造新知识？

布尔函数操作符的神经网络

在此基础上可通过连接NAND、AND和OR的NNs来构造异或运算神经网络。所以异或变成了一个三层神经网络。

什么？神经网络还能创造新知识？

异或运算的神经网络

输送可能的输入配置并检查输出(本文使用Excel工作表)。分别得到有效的(0,0)、(1,1)的0.0072以及(0,1)、(1,0)的0.9924。

可以用以下异或运算的表示来建构其他的神经网络：

XOR (x,y) = OR ( AND ( NOT(x) , y ) , AND ( x , NOT(y) ) )

XOR (x,y) = NAND ( NAND ( x , NAND ( x,y) ) , NAND ( y , NAND ( x,y) ) )

然而这些标识列导致了更复杂的网络。

此外，由于异或运算不能通过线性可分(且激活函数严格单调)，因此，不可能建立两层的神经网络。

但也许还有其他方法可以构建异或运算的神经网络呢?下一节将通过训练神经网络来寻找另一种解决方案。

什么？神经网络还能创造新知识？

使用TensorFlow Keras构建异或神经网络

Keras是一个功能强大且易于使用的神经网络库。上一节中建立了一个三层的2-2-1模型，并与之前建构的神经网络进行了比较。

使用梯度下降优化器与学习率1和均方误差损失函数的误差反向传播，这是建构神经网络的标准方法。

以下是Python的代码片段：

# Generate NN for XOR operation
# input layer: &lt;NODES&gt; nodes, one for each bit (0 = false and +1 = true)
# output layer: 1 node for result (0 = false and +1 = true)
# Use sigmoid activation function, gradient descent optimizer and mean squared error loss function
# Last update: 28.05.2019
 
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
 
# Define model
nodes = 2
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(nodes, input_dim=2, activation=tf.nn.sigmoid))
model.add(tf.keras.layers.Dense(1, activation=tf.nn.sigmoid))
model.compile(optimizer=tf.train.GradientDescentOptimizer(1), loss=tf.keras.losses.mean_squared_error, metrics=['binary_accuracy'])
model.summary()
 
# Generate train &amp; test data
epochs = 10000
data_in = np.array([[0,0],[0,1],[1,0],[1,1]])
data_out = np.array([0,1,1,0])
 
# Train model
history = model.fit(data_in, data_out, epochs=epochs, verbose=0)
 
# Analysis of training history
for key in history.history.keys():
 plt.scatter(range(epochs), history.history[key], s=1)
 plt.ylabel(key)
 plt.xlabel('epochs')
 plt.show()
 
# Predict with model
result = model.predict(data_in)
 
# Print results
def printarray(arr):
 return np.array2string(arr).replace('
','')
 
print()
print('input', printarray(data_in))
print('output (calculation)', printarray(data_out))
print('output (prediction) ', printarray(result))
print('output (pred. norm.)', printarray(np.round(result)))
 
# Get weights of model
print()
print(model.get_weights())

异或运算的好处是可以训练整个参数空间，因为只有四种可能的配置可以教。然而，需要一些在神经网络中传递数据集的过程来驱动模型达到零损耗和100%精准，即输出趋向于一个分别是(0,1)、(1,0)和(0,0)、(1,1)的零。

什么？神经网络还能创造新知识？

异或运算神经网络的Loss和epochs对比

什么？神经网络还能创造新知识？

异或运算神经网络的Accuracy 和epochs对比

然而，训练期也可能陷入停滞，无法衔接。接着精准度停止在75%甚至50%，即一个或两个二元元组的映射是不正确的。在这种情况下就要重新构建神经网络，直到得到合适的解决方案。

什么？神经网络还能创造新知识？

分析和结论

现在验证Keras神经网络是否与建构的具有相似结构。通过返回权值(参见代码片段的末尾)，得到了权值和偏差值。

什么？神经网络还能创造新知识？

Python的脚本输出

使用这些参数来重建神经网络(再次使用Excel)。由三个操作符组成。

什么？神经网络还能创造新知识？

基于Keras训练的异或运算神经网络

通过输入所有可能的配置，可以识别与H1、H2和O操作符关联的布尔函数。

什么？神经网络还能创造新知识？

Keras在异或运算神经网络中的布尔函数

有趣的是，本以为Keras 神经网络与所建构的逻辑是一样的，但它却创建了另一种解决方案。使用OR，AND和(相对没人知道的)INH，而非操作符NAND, OR 和AND，即神经网络找到的公式。

XOR (x,y) = INH ( OR (x,y), AND (x,y) )

这表明神经网络可以获得以前没有的知识!当然“新知识”是相对的，并且取决于知道的程度。也就是说，若一个人知道异或运算的所有表示形式，Keras 神经网络就不会有其他价值。

此外，对于更复杂的神经网络，将权值转换为显式算法或公式并不容易。但也许这种专业知识是未来人工智能专家必须具备的能力。

什么？神经网络还能创造新知识？

留言点赞关注

我们一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

神经网络异或

cherry0

0 关注 0 粉丝 0 动态

相关推荐

对迁移学习中域适应的理解和3种技术的介绍

域适应是计算机视觉的一个领域，我们的目标是在源数据集上训练一个神经网络，并确保在显著不同于源数据集的目标数据集上也有良好的准确性。为了更好地理解域适应和它的应用，让我们先看看它的一些用例。我们有很多不同用途的标准数据集，比如GTSRB用于交通标志识别，LI

皮皮虾大侠 12评论 2020-11-10

仅有算法远远不够：AI突破下一站，需要对硬件重新审视

如今的人工智能存在一个很重要问题：太贵了。训练现代计算机视觉模型Resnet-152的成本大约为100亿浮点运算，这比起现代语言模型相形见绌。训练OpenAI的最新自然语言模型GPT-3预计耗费3000万亿浮点运算，其中在商用GPU上的成本至少为500万美

Site 15评论 2020-11-07

选择困难终结者：不同问题之下的机器学习算法

刚开始学习数据科学时，笔者经常面临这样一个问题：遇到具体问题，选择何种算法才合适。也许你也和我一样，搜了很多有关机器学习算法的文章，会看到许多详细的描述，却并没有减少让抉择的难度。问题陈述2：深挖客户统计数据用以识别模式。问题陈述12：根据车辆特性预估车辆

lwnylslwnyls 2020-11-06

自动驾驶汽车深度学习如何应对挑战?

在自动驾驶汽车中使用深度学习可以帮助克服各种挑战，例如了解行人的行为，找到最短的路线以及对人和物体进行准确检测。根据一份报告，2018年约有80%的道路交通事故是由于人为错误造成的。因此，将自动驾驶汽车纳入主流的主要目标之一是消除对人类驾驶员的需求并减少道

86377811 2020-11-06

破解宇宙奥秘，为何人工智能是关键？

千百年来，人类对于宇宙一直抱有极大的好奇心。仰望天空，你会不禁感叹宇宙之大，那里有太多的东西需要人们去探索和发现。浩瀚宇宙，美丽如斯，宇宙学家和天体物理学家都在尽力揭开宇宙的神秘面纱。卫星每年传送下来数百兆字节的信息，智利正在建设的一台望远镜每晚将产生15

遇见人工智能 11评论 2020-11-03

如何在PyTorch和TensorFlow中训练图像分类模型

图像分类是计算机视觉的最重要应用之一。它的应用范围包括从自动驾驶汽车中的物体分类到医疗行业中的血细胞识别，从制造业中的缺陷物品识别到建立可以对戴口罩与否的人进行分类的系统。他们是如何做到的呢？你必须已阅读很多有关不同深度学习框架之间差异的信息。Tensor

xjtukuixing 11评论 2020-10-27

回归根基：5篇必读的数据科学论文，帮你保持领先地位

谷歌研究团队提供了在创建数据科学工作流时要避免的反模式的明确说明。这篇论文把技术债的隐喻从软件工程借鉴过来，将其应用于数据科学。假设检验的提出早于计算机的使用。

Evan 11评论 2020-10-26

全面的数据科学C/C++机器学习库整理，再也不用百度搜了

引言和动机--为什么是C++?C++是动态负载平衡、自适应缓存、开发大型数据框架和库的理想选择。以超低延迟和极高吞吐量著称的Scylla，使用C++作为Apache Casand and Amazon DynDoDB的替代者进行编码。C++作为编程语言的

xceman 10评论 2020-10-23

DeepMind发了篇物理论文，用神经网络求解薛定谔方程

只要解出薛定谔方程，你就能预测分子的化学性质。但现实很骨感，迄今为止，科学家只能精确求解一个电子的氢原子，即使是只有两个电子的氦原子都无能为力。原因是有两个以上电子组成的薛定谔方程实在太复杂，根本无法精确求解。近日，DeepMind开源了一个“费米网络”，

georgesale 2020-10-21

4个计算机视觉领域用作迁移学习的模型

使用SOTA的预训练模型来通过迁移学习解决现实的计算机视觉问题。如果你试过构建高精度的机器学习模型，但还没有试过迁移学习，这篇文章将改变你的生活。我们大多数人已经尝试过，通过几个机器学习教程来掌握神经网络的基础知识。这些教程非常有助于了解人工神经网络的基本

xceman 2020-10-15

机器翻译：谷歌翻译是如何对几乎所有语言进行翻译的？

谷歌翻译大家想必都不陌生，但你有没有想过，它究竟是如何将几乎所有的已知语言翻译成我们所选择的语言？本文将解开这个谜团，并且向各位展示如何用长短期记忆网络构建语言翻译程序。第一部分简单介绍神经网络机器翻译和编码器-解码器结构。什么是机器翻译？在机器翻译领域，

WhiteHacker 2评论 2020-10-11

算法中的微积分：5大函数求导公式让你在面试中脱颖而出

就业市场上，机器学习工程师总是受到质疑，人们不相信他们数学功底深厚。事实上，所有机器学习算法的本质都是数学问题，无论是支持向量机、主成分分析还是神经网络最终都归结为对偶优化、谱分解筛选和连续非线性函数组合等数学问题。只有彻底理解数学，才能正真掌握这些机器学

hexianhao 2评论 2020-10-06

科学家用机器人体外操控了小鼠脑神经！不到 1 分钟实现通信连接

本文转自雷锋网，如需转载请至雷锋网官网申请授权。但是，上面这款机器人可不普通，它带有神经元，能通过体外方式在神经簇之间形成并操纵神经网络。原因在于，这种方法可以在尽可能降低外部影响的前提下，在大脑目标位置进行精确的、有选择性的神经连接，从而测量神经活动、确

大白机器人 2020-09-30

深度学习之后会是啥？

我们被困住了，或者说至少我们已经停滞不前了。有谁还记得上一次一年没有在算法、芯片或数据处理方面取得重大显著进展是什么时候?几周前去参加Strata San Jose会议，却没有看到任何吸引眼球的新进展，这太不寻常了。我不是唯一一个注意到这些的人。例如，这

mpkno 2020-09-26

标准出现问题，人工智能正在走向错误的方向

我的这篇文章不是第一篇讨论人工智能界如何按自身规律发展的文章。正如不久前汉娜·克纳的话：“很多AI研究人员认为现实世界中的问题无关紧要。社区过度关注新方法，却忽略了真正要紧的事情。”许多大型会议公然忽视了应用型论文，这些文章聚焦于使用目前的技术解决现实世界

hiarxiaoliang 2020-09-23

自然语言处理必读：5本平衡理论与实践的书籍

当谈到学习方法时，我们常常会提到教程、博客文章、在线课程等等，书本总是会被忽略掉。即使是在找一本关于某个主题的书，也会很快发现这样的书太多了，无法快速判断哪一本最适合自己。它也称为NLTK书籍，应用Python进行自然语言处理在整个过程中都很大程度上依赖于

MakeRoomFor 2020-08-30

8个机器学习项目创意，助你在求职竞争中脱颖而出

本文转载自公众号“读芯术”。纸上得来终觉浅，绝知此事要躬行。光看教程是不够的，你需要通过实践来掌握更多更真实的内容。以下有8个创意十足的机器学习实操项目供你选择，赶紧行动起来吧!世界上有超过2.64亿人患有抑郁症。但与之相对的是，针对抑郁症的治疗却经常不到

lirika 2020-08-29

为什么AI感知与人类感知无法直接比较？

在开发AI系统的企业中，我们经常会听到这类表述，其指向范围则涵盖人脸识别、物体检测，乃至问题解答等各个方面。随着机器学习与深度学习的不断进步，近年来越来越多卓越的产品也开始将AI算法作为自身的实现基础。一旦贸然将关键性任务交付给AI模型，这种草率的考核标准

PokiFighting 2020-08-27

用C语言从头开始实现一个神经网络

本文转自雷锋网，如需转载请至雷锋网官网申请授权。在本文中，我们将用C语言从头开始实现一个基本的神经网络框架。在C语言中实现反向传播实际上会让我们更详细地了解改变权重和偏差是如何改变网络的整体行为的。我们的目标是建立一个通用的框架，其中的层数和神经元将由用户

cetrolchen 2020-08-14

图同构下等变,计算高效,韦灵思团队提出\"自然图网络\"消息传递方法

近日，韦灵思团队的一项研究通过研究图的局部对称性，提出了一种新的算法。该算法在不同的边上使用不同的核，从而使网络在局部与全局的图同构体上是等变的，也更易于表达。通常来说，常规神经消息传递算法在消息排列下是不变的，因此会忘记信息流如何在网络中传递。结果表明，

hnyzyty 2020-08-04

cherry0

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号