干货深入浅出LSTM及其Python

人工神经网络在近年来大放异彩,在图像识别、语音识别、自然语言处理与大数据分析领域取得了巨大的成功,而长短期记忆网络LSTM作为一种特殊的神经网络模型,它又有哪些特点呢?作为初学者,如何由浅入深地理解LSTM并将其应用到实际工作中呢?本文将由浅入深介绍循环神经网络RNN和长短期记忆网络LSTM的基本原理,并基于Pytorch实现一个简单应用例子,提供完整代码。

1.神经网络简介

1.1神经网络起源

人工神经网络(AritificialNeuralNetworks,ANN)是一种仿生的网络结构,起源于对人类大脑的研究。人工神经网络(AritificialNeuralNetworks)也常被简称为神经网络(NeuralNetworks,NN),基本思想是通过大量简单的神经元之间的相互连接来构造复杂的网络结构,信号(数据)可以在这些神经元之间传递,通过激活不同的神经元和对传递的信号进行加权来使得信号被放大或衰减,经过多次的传递来改变信号的强度和表现形式。

神经网络最早起源于20世纪40年代,神经科学家和控制论专家WarrenMcCulloch和逻辑学家WalterPitts基于数学和阈值逻辑算法创造了最早的神经网络计算模型。由于当时的计算资源有限,无法构建层数太多的神经网络(3层以内),因此神经网络的应用范围很局限。随着计算机技术的发展,神经网络层数的增加带来的计算负担已经可以被现代计算机解决,各位前辈大牛对于神经网络的理解也进一步加深。历史上神经网络的发展大致经历了三次高潮:20世纪40年代的控制论、20世纪80年代到90年代中期的联结主义和年以来的深度学习。深度学习的出现直接引爆了一部分应用市场,这里有太多的案例可以讲,想了解的读者可参考下面的链接:

[深度学习发展史](


转载请注明:http://www.aierlanlan.com/rzdk/3288.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了