深度学习笔记

2019-09-22 约 965 字预计阅读 2 分钟收录于机器学习

激活函数

sigmoid函数主要用于二元分类的输出层，其他情况不推荐使用
与sigmoid相比，tanh激活函数一般要优与sigmoid函数，因为其均值为0，当用在分类时，因最后的结果最好为概率，故最后的输出层可用sigmoid函数，否则优先考虑tanh函数
更受欢迎的则是ReLU函数，因梯度下降快，训练速度快

参数与超参数

参数：W,B
超参数：激活函数、学习率、隐藏层数量、隐藏单元数量、迭代次数
超参数决定了参数w和b的最终值

卷积神经网络CNN

卷积、padding、步长

原始图像矩阵通过与过滤器(核)进行卷积操作可检测出图像的边缘（此处所说的卷积为数学上的互相关，而并不是真正的数学意义上的卷积），使用卷积的一个重要原因为其可减少数据规模(不准确但差不多)，方便训练

padding是为了解决图像外围像素不能够有效利用(或边缘像素会损失信息)的问题，通常在原始图像周围加入几层像素，以达到在经过卷积之后的图像大小与原始图像相同
所以，假设原始图像矩阵大小为n*n,过滤器为f*f,则输出的图像为(n-f+1)*(n-f+1),若想通过padding之后使得变换后的图像大小不变(假设填充了p层)，则有n-f+1+2p=n,即p=(f-1)/2，从结果可看出，过滤器通常为奇数矩阵

步长为过滤器在图像上移动到下一个位置时距离上一个位置的像素间隔
如果设置的步长为s，则输出的图像大小为(n-f+2p)/s + 1，结果向下取整