温馨提示:这篇文章已超过461天没有更新,请注意相关的内容是否还可用!
摘要:本文介绍了深度学习的数学基础,重点涉及Homework2的内容。文章强调了线性代数、概率论和数学优化在深度学习中的应用,并探讨了它们在构建和训练神经网络中的作用。通过深入理解这些数学原理,可以更好地掌握深度学习技术,有效解决实际问题和挑战。
[https://www.bilibili.com/video/BV1mg4y187qv/?spm_id_from=333.788.recommend_more_video.1&vd_source=d6b1de7f052664abab680fc242ef9bc1](https://www.bilibili.com/video/BV1mg4y187qv/%3Fspm_id_from=333.788.recommend_more_video.1%26vd_source=d6b1de7f052664abab680fc242ef9bc1)。
神经网络的特点:它是一种非线性模型,其知识储存在大量参数之中,难以直观解释其物理意义,这些参数共同确定一个超平面。
评价神经网络的好坏:我们主要关注其泛化能力,即在测试集上的表现,而非仅仅是训练精度。
简要历史回顾:
1、1943年的M-P模型以文字、公式和图形描述了神经元的基础结构。
2、1958年,单层感知器出现。
3、1986年,误差反向传播算法(BP算法)被引入,解决了多层感知器的隐层权重求解问题。
附加说明:
1、数学模型是对真实世界的抽象,因此可以简化掉一些不重要的细节。
2、加权求和是神经元对接收到的信号进行空间整合的过程(不考虑时间整合是因为模型假设信号是同时到达的)。
3、阈值的存在是因为并非所有膜电位的改变都会导致神经元输出,只有当膜电位超过一定阈值时,神经元才会产生输出,这里的输出与膜电位变化值之间是一个函数关系,其中f是输出函数(转移函数或激活函数)。
4、多层感知器(也称为三层BP网)中的“三层”是指输入层、隐藏层和输出层,尽管名为三层,但实际上只有两层具有信号处理能力。
5、误差信号(δ)在网络中起着关键作用,它方便表示权值修正公式,并从网络反向传播的角度看,误差信号作为输入层的信号可以计算隐藏层的误差,误差信号的构成包括三个部分。
6、误差反向传播的原因:只有输出层有教师信号(监督信号),因此只有输出层的误差可以计算,中间层并没有教师信号,导致隐藏层的误差无法计算,因此也无法调整权值,为了调整初始的权值参数,我们使用输出层的误差信号进行反向传播,在这个过程中,误差信号相当于一个输入向量,经过加权求和得到隐藏层的误差信号,一旦获得了隐藏层的误差信号,就可以计算出权值的调整公式。
附加图像描述:[这里插入描述单层感知器和神经网络工作原理的图片]。
单层感知器的功能:它是一个线性分类器,其分类知识以分布式的方式存储在权向量(参数)中,调参就是调整分类界面的位置。
还没有评论,来说两句吧...