9-深度学习
深度学习网络:学习良好的非线性结构
- 从模式识别的角度看
- 手工特征:固定、难以设计、人工、低层特征、需要专业知识、分离的
- 深度学习:可学习的、黑盒的、任务相关、学习层次表示和高级特征、端到端的
1. 基础知识
1.1. 卷积 Convolution
从图像处理中发展出来
- 特征提取
- 超参数:depth,stride,zero-padding
- depth: filter的数量
- zero-padding: 输入特征图的周围填充一圈零值像素。填充的目的是为了保持输入和输出特征图的尺寸一致或者控制尺寸的变化。
- stride: 指卷积核在输入特征图上滑动的步长
- 过滤器: 与输入数据的局部区域进行逐元素相乘,并将结果相加,从而提取输入数据中的特征
- 也被称为卷积核(convolutional kernel)或特征检测器(feature detector),它是一个小的矩阵或张量,用于在输入数据上进行卷积操作。
CS231n Convolutional Neural Networks for Visual Recognition
1.2. 池化Pooling/下采样Subsampling
减少参数
避免过拟合
扩大感受域
常用方法
- Max Pooling
- Average Pooling
max pooling:
1.3. 全连接层
MLP
FC Layer:全局特征提取
Softmax Layer:分类层
1.4. Dropout
参数过多,但数据又不够时,容易过拟合
每个神经元以固定概率p被弃用
1.5. Batch Normalization
为了让神经网络更深,减少网络内部方差偏移或梯度扩散
对每一层神经网络的输出做归一化
2. 深度学习技巧
- 数据增广 Data Agumentation
- 预处理 Pre-Processing
- 初始化 Initilization
- 过滤器 Filter
- Batch size
- Filter、stride
- 池化大小 Pooling size
- 学习率 Learning rate
- 和使用的优化器有关系
- 标题: 9-深度学习
- 作者: Charlie
- 创建于 : 2023-12-26 20:07:00
- 更新于 : 2024-07-05 12:55:04
- 链接: https://chillcharlie357.github.io/posts/68ad7582/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论