PyTorch实现循环神经网络

liqing

2020-02-14

import torch
import torch.nn as nn
import time
import math
import sys
sys.path.append("/home/kesci/input")
import d2l_jay9460 as d2l
(corpus_indices, char_to_idx, idx_to_char, vocab_size) = d2l.load_data_jay_lyrics()
device = torch.device(‘cuda‘ if torch.cuda.is_available() else ‘cpu‘)

rnn_layer = nn.RNN(input_size=vocab_size, hidden_size=num_hiddens)
num_steps, batch_size = 35, 2
X = torch.rand(num_steps, batch_size, vocab_size)
state = None
Y, state_new = rnn_layer(X, state)
print(Y.shape, state_new.shape)

class RNNModel(nn.Module):
    def __init__(self, rnn_layer, vocab_size):
        super(RNNModel, self).__init__()
        self.rnn = rnn_layer
        self.hidden_size = rnn_layer.hidden_size * (2 if rnn_layer.bidirectional else 1) 
        self.vocab_size = vocab_size
        self.dense = nn.Linear(self.hidden_size, vocab_size)

    def forward(self, inputs, state):
        # inputs.shape: (batch_size, num_steps)
        X = to_onehot(inputs, vocab_size)
        X = torch.stack(X)  # X.shape: (num_steps, batch_size, vocab_size)
        hiddens, state = self.rnn(X, state)
        hiddens = hiddens.view(-1, hiddens.shape[-1])  # hiddens.shape: (num_steps * batch_size, hidden_size)
        output = self.dense(hiddens)
        return output, state

def predict_rnn_pytorch(prefix, num_chars, model, vocab_size, device, idx_to_char,
                      char_to_idx):
    state = None
    output = [char_to_idx[prefix[0]]]  # output记录prefix加上预测的num_chars个字符
    for t in range(num_chars + len(prefix) - 1):
        X = torch.tensor([output[-1]], device=device).view(1, 1)
        (Y, state) = model(X, state)  # 前向计算不需要传入模型参数
        if t < len(prefix) - 1:
            output.append(char_to_idx[prefix[t + 1]])
        else:
            output.append(Y.argmax(dim=1).item())
    return ‘‘.join([idx_to_char[i] for i in output])

循环神经网络

liqing

0 关注 0 粉丝 0 动态

相关推荐

深度学习面试题32：循环神经网络原理(RNN)

RNN 的英文全称是 Recurrent Neural Networks ，即循环神经网络，他是一种对序列型数据进行建模的深度模型。在学习之前，先来复习基本的单层神经网络。单层网络的输入是向量x，经过Wx+b和激活函数f得到输出y。自然语言处理问题中，x1

hnyzyty 2020-07-05

【DL-3】循环神经网络（RNN）

RNN是一类用于处理序列数据的神经网络。这些序列比较长，且长度不一，比较难直接的拆分成一个个独立的样本来通过DNN/CNN进行训练。这幅图描述了在序列索引号t附近RNN的模型。1）x代表在序列索引号t时训练样本的输入。

wenxuegeng 2020-04-08

Tensorflow--RNN-LSTM循环神经网络（四）

# Batch size : 批次(样本)数目。一次迭代所用的样本数目。Batch size 越大，所需的内存就越大。每一次迭代更新一次权重，每一次权重更新需要 Batch size 个数据进行 Forward 运算，再进行 BP 运算。# Epoch :

hnyzyty 2020-02-22

RNN循环神经网络学习——概述

　　循环神经网络的主要用途是处理和预测序列数据。循环神经网络最初就是为了刻画一个序列当前的输出与之前信息的关系。也就是说，循环神经网络的隐藏层之间的节点是有连接的，隐藏层的输入不仅包含输入层的输出，还包括上一时刻隐藏层的输出。RNN当前的状态是由上一时刻的

cherry0 2019-12-01

循环神经网络导读

循环神经网络是一类以序列数据为输入，在序列的演进方向进行递归且所有节点按链式连接的递归神经网络。其中双向循环神经网络和长短期记忆网络是常见的的循环神经网络。今天，小编带你认识常见的几种循环神经网络模型，主要内容来自Colah的博客，外加一些自己的总结，一起

georgesale 2019-10-25

序列模型简介——RNN, Bidirectional RNN, LSTM, GRU

这些模型的问题在于，当给定一系列的数据时，它们表现的性能很差。序列数据的一个例子是音频的剪辑，其中包含一系列的人说过的话。前馈网络和CNN采用一个固定长度作为输入，但是，当你看这些句子的时候，并非所有的句子都有相同的长度。这就是序列模型和前馈模型的主要区别

aaJamesJones 2019-06-30

Tensorflow快餐教程(10) - 循环神经网络

循环神经网络上节介绍了在图像和语音领域里大放异彩引发革命的CNN。这类问题的特点是上下文相关序列，比如理解文字。这时需要一种带有记忆的结构，于是，深度学习中的另一法宝RNN横空出世了。这种网络被称为Hopfield网络。而两年扣BP网络被重新发明，全连接前

georgesale 2019-06-27

使用循环神经网络-长短期记忆（RNN-LSTM）预测比特币和以太币价格

2017年对人工智能和加密货币来说是重要的一年, 我们见证了许多新的研究进展和突破。毋庸置疑，人工智能是当今甚至今后很长一段时间内最令人瞩目的技术之一。而加密货币在这一年中的热度之高是我所没有预料到的，这是加密货币的一波大牛市，投资加密货币的资回报率几近疯

格式化中 2019-06-27

（一）线性循环神经网络（RNN）

该教程将介绍如何实现一个循环神经网络，一共包含两部分。你可以在以下链接找到完整内容。（一）线性循环神经网络（二）非线性循环神经网络这篇教程中的代码是由 Python 2 IPython Notebook产生的，在教程的最后，我会给出全部代码的链接，帮助学习

格式化中 2019-06-26

数据科学家必备：从零开始用 Python 构建循环神经网络（附代码）

本文约4300字，建议阅读10+分钟。本文带你快速浏览典型NN模型核心部分，并教你构建RNN解决相关问题。人类不会每听到一个句子就对语言进行重新理解。看到一篇文章时，我们会根据之前对这些词的理解来了解背景。我们将其定义为记忆力。这就是循环神经网络发挥作用的

RitterLiu 2019-03-09

一文读懂序列建模（deeplearning.ai）之循环神经网络(RNNs)

本文为你详细介绍序列模型，并分析其在不同的真实场景中的应用。简介如何预测一个序列中接下来要发生什么事情是一个非常吸引人的课题，这是我对数据科学如此着迷的原因之一！有趣的是——人类的头脑确实擅长于此，但是机器却不是这样的。多亏了深度学习，我们今天能做的事情比

RitterLiu 2019-03-01

艺术家如何应用RNN（循环神经网络）创作AI化的艺术作品

文章导读：这篇文章不是为了全面深入的介绍循环神经网络，而是为那些没有任何机器学习背景知识的读者提供一种思路，意在展示艺术家和设计师运用简单的Javascript和p5.js库构造预训练神经网络、进而创作出交互式数字作品的过程。近年来，对于那些富有创造性的群

RitterLiu 2017-01-10

万字长文概述NLP中的深度学习技术之循环神经网络

循环神经网络的思路是处理序列信息。「循环」表示 RNN 模型对序列中的每一个实例都执行同样的任务，从而使输出依赖于之前的计算和结果。通常，RNN 通过将 token 挨个输入到循环单元中，来生成表示序列的固定大小向量。一定程度上，RNN 对之前的计算有「记

liqing 2019-02-28

数据科学家必读：从零开始用Python构建循环神经网络

人类不会每听到一个句子就对语言进行重新理解。看到一篇文章时，我们会根据之前对这些词的理解来了解背景。我们将其定义为记忆力。这就是循环神经网络发挥作用的地方。循环神经网络在深度学习领域非常热门，因此，学习循环神经网络势在必行。我们总是习惯用高级Python库

arsenicer 2019-04-17

从零开始用 Python 构建循环神经网络

人类不会每听到一个句子就对语言进行重新理解。看到一篇文章时，我们会根据之前对这些词的理解来了解背景。我们将其定义为记忆力。但令人遗憾的是传统的神经网络还无法做到这一点。这就是循环神经网络发挥作用的地方。循环神经网络在深度学习领域非常热门，因此，学习循环神经

天在那边 2019-04-07

入门｜一文简述循环神经网络

选自Hackernoon，作者：Debarko De，机器之心编译，参与：李诗萌、路。本文简要介绍了什么是循环神经网络及其运行原理，并给出了一个 RNN 实现示例。本文试图回答上述这些问题，还展示了一个 RNN 实现 demo，你可以根据自己的需要进行扩展

xdq0 2018-07-22

循环神经网络不需要训练？复现「世界模型」的新发现

这篇论文在今年 3 月份出现时引起了人们的热烈讨论。本文深入探讨了这篇基于模型的强化学习的研究，该论文在颇具挑战的 CarRacing-v0 环境中的表现令人惊喜。编码器的任务是将输入图像压缩为一种紧密的潜在表征。为了减少计算量，我们在 rollout 的

mingzheng 2018-06-30

新型循环神经网络IndRNN：可构建更长更深的RNN

循环神经网络 [16] 已在动作识别 [8]、场景标注 [4] 、语言处理 [5] 等序列学习问题中获得广泛应用，并且成果显著。与卷积神经网络等前馈网络相比，RNN 具有循环连接，其中最后的隐藏状态是到下一状态的输入。状态更新可描述如下：。分别为当前

hexianhao 2018-03-20

使用循环神经网络-长短期记忆(RNN-LSTM)预测比特币和以太币价格

2017年对人工智能和加密货币来说是重要的一年, 我们见证了许多新的研究进展和突破。毋庸置疑，人工智能是当今甚至今后很长一段时间内最令人瞩目的技术之一。而加密货币在这一年中的热度之高是我所没有预料到的，这是加密货币的一波大牛市，投资加密货币的资回报率几近疯

liqing 2018-04-10

使用PyTorch从零开始构建Elman循环神经网络

本文以最简单的RNNs模型为例：Elman循环神经网络，讲述循环神经网络的工作原理，即便是你没有太多循环神经网络的基础知识，也可以很容易的理解。为了让你更好的理解RNNs，我们使用Pytorch张量包和autograd库从头开始构建Elman循环神经网络。

夜晚00 2018-03-30

liqing

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号